Muchos  procedimientos  clásicos 
permiten  al  ordenador  resolver  algunos 
juegos  sencillos.  Otros  más  complejos, 
como  el  ajedrez,  precisan  técnicas  más 
eficientes  para  su  resolución. 

La  Inteligencia  artificial  proporciona 
dichas  técnicas.  La  aplicación  de  éstas 
hace  que  los  programas  se  comporten 
de  forma  inteligente  simulando  el 
razonamiento  humano. 

El  seguimiento  de  este  libro  y la 
realización  de  los  ejercicios  prácticos 
que  en  él  se  proponen  Introducirán  al 
lector  en  el  manejo  adecuado  de  estos 
métodos. 


Se  estudian  juegos  tan 
conocidos  como  ajedrez, 
damas,  dominó, 

mastermind,  rompecabezas,  ~ 

torres  de  Hanoi,  etc.,  además  de  los 
procedimientos  básicos  para 
enfrentarse  con  otros  juegos  o 
problemas  similares. 


juegos  inteligentes  en  mi  croo  i 
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Técnicas  utilizadas  en  Inteligencia 
Artificial 

Juegos  contra  la  naturaleza  o de  un 
jugador 

Juegos  contra  un  contrincante 
inteligente 


Los  programas  que  aparecen  en  este  libro  funcionan  en  los 
ordenadores: 

IBM-PC,  XT.  AT  y compatibles. 
AMSTRAD-464,  664,  6128,  1512. 
SINCLAIR-SPECTRUM  48  K.  128  K,  PLUS.  PLUS  2. 
MSX -Todos  los  modelos. 

COMMODORE-CBM  64  y CBM  128. 


PROLOGO— 


S una  satisfacción  para  cualquier  persona  que  se  dedique 
a la  enseñanza  el  ver  cómo  un  grupo  de  ex  alumnos,  y hoy 
colaboradores,  se  asoman  al  exterior  mediante  la  publica* 
ción  de  libros,  artículos  en  revistas,  etc.  Tras  dos  años  de 
intenso  trabajo  en  el  laboratorio,  durante  el  cual  se  han  fa- 
miliarizado con  la  Inteligencia  Artificial  y sus  técnicas, 
sale  a la  luz  este  libro,  que  suple  en  parte  la  carencia  de 
textos  en  idioma  español  que  hay  sobre  este  tema.  Real- 
mente. el  trabajo  realizado  para  escribir  este  libro  es.  ade- 
más de  meritorio,  útil,  pues  incluye  una  gran  parte  de  recopilación,  sínte- 
sis y redacción,  incorporando  parte  del  conocimiento,  tanto  teórico  como 
práctico,  que  poseen  sobre  la  materia. 

Es  seguro  que.  tras  leer  este  libro,  el  lector  se  va  a sentir  atraído  por 
el  área  de  la  Inteligencia  Artificial,  lo  que  puede  impulsar  su  utilización. 

Por  otra  parte,  el  hecho  de  ser  una  obra  de  divulgación,  en  el  sentido 
más  noble  del  término,  no  le  resta  un  ápice  de  rigor  conceptual.  Tanto  las 
ideas  como  los  ejercicios  y ejemplos  que  las  desarrollan  son  sencillos  y ade- 
cuados para  el  objetivo  propuesto. 

Por  todo  ello,  es  posible  afirmar  que  el  éxito  de  la  publicación,  por  me- 
recido. está  garantizado. 


Juan  Pazos  Sierra 

Vicedecano  de  Relaciones  Exteriores 
Facultad  de  Informática  de  Madrid 
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INTRODUCCION 


OS  juegos  han  sido  muy  estudiados  a lo  largo  de  la  histo- 
ria e incluso  se  ha  establecido  un  modelo  matemático,  de- 
sarrollando una  serie  de  técnicas  y algoritmos  que  resuel- 
van los  juegos  (que  sepan  jugar)  conocido  como  teoría  de 
juegos. 

Los  rompecabezas  y juegos  serán  problemas  fácilmen- 
te tratables  por  el  computador  en  la  medida  en  que  sean 
precisos  y estén  bien  formulados.  Además,  el  conocimien- 
to adquirido  durante  la  resolución  de  los  mismos  puede 
ser  transferido  a problemas. 

A la  hora  de  resolver  un  juego  aparece  el  probema  de  alcanzar  una  si- 
tuación deseada.  La  situación  inicial  se  irá  modificando  mediante  movi- 
mientos o acciones  que  conduzcan  al  estado  objetivo.  Entre  todas  las  ac- 
ciones posibles  habrá  que  elegir  aquélla  que  sea  más  conveniente.  La  com- 
plejidad del  problema  radica  en  el  elevado  número  de  combinaciones  exis- 
tentes. En  cada  momento  del  juego  debe  considerarse  el  número  de  juga- 
das o acciones  distintas  que  pueden  realizarse,  así  como  las  futuras  con- 
secuencias de  aplicación  de  cada  una  de  ellas.  La  elección  de  una  u otra 
acción  influirá  sobre  las  demás,  por  lo  que  el  número  de  consideraciones 
a tener  en  cuenta  en  cada  momento  para  asegurar  la  eficiencia  de  un  mo- 
vimiento puede  llegar  a ser  inalcanzable,  tanto  para  la  mente  humana 
como  para  la  capacidad  computaciqnal  de  un  computador.  Dentro  de  este 
numero  tan  elevado  sólo  unas  pocas  secuencias  de  acciones  conducirán  a 
la  situación  deseada. 

En  un  principio,  la  teoría  de  juegos  fue  estudiada  por  la  rama  de  la  cien- 
cia denominada  Investigación  Operativa  (IO).  Las  técnicas  que  la  IO  pro- 
porciona para  resolver  un  juego  serán  aplicables  si  existe  un  procedimien- 
to suficientemente  finito.  Se  entiende  por  suficientemente  finito  aquel  al- 
goritmo que  se  puede  ejecutar  utilizando  una  cantidad  razonable  de  recur- 
sos de  ordenador  (tiempo  y memoria). 
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Cuando  no  exista  o no  se  conozca  un  algoritmo  aplicable  al  iueao  o exis 

%JSS=SSH5== 

g^LTlAad0raS  ,,evan  raudamente  hasta  la  solución  final 

sn-y  Csrsst 

^íssssssssS 

Las  heurisncas  se  introducir*!,  en  los  método,  de  búsqueda  de  solucio- 

cuen^^r^u^d:'  nÜmer°  * C“’ÍnOS  ’ — - 

ción^Se  exponen  unas  n^on^bilÍ,  lob 

comí*«  dUSP  C°m°  'íngUaÍC  *decu*do  P“»  « programación. 
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TECNICAS  UTILIZADAS 
EN  INTELIGENCIA  ARTIFICIAL 


ALGORITMOS  DE  BUSQUEDA 

UANDO  se  plantea  la  posibilidad  de  escribir  un  programa 
que  actúe  de  acuerdo  con  unas  reglas  determinadas  en 
contra  de  un  adversario,  es  decir,  cuando  se  desea  progra- 
mar un  juego,  éste  debe  plantearse  como  un  problema 
cualquiera  al  que  ha  de  encontrarse  solución,  y no  una  so- 
lución cualquiera,  sino  la  solución  óptima. 

La  IA  mostró  desde  sus  comienzos  un  especial  interés 
por  los  juegos,  ya  que  en  ellos  el  ser  humano  debe  de- 
sarrollar y utilizar  todas  sus  capacidades  cognoscitivas  c 
intelectuales,  preocupación  principal  de  los  estudios  en  IA. 

Asi,  pues,  planteado  el  juego  como  un  problema,  pueden  utilizarse  para 
\u  resolución  las  técnicas  de  IA.  Una  de  ellas  es  la  búsqueda.  El  proceso 
de  búsqueda,  en  general,  es  aplicable  a todos  los  tipos  de  problemas  en 
los  que  la  adquisición  y recuperación  de  información  constituye  una  parte 
importante. 

Existen  muchos  métodos  de  búsqueda  que  pueden  asimismo  clasificar- 
se de  formas  muy  diferentes  atendiendo  a criterios  dispares.  Todos  ellos, 
sin  embargo,  dependen  en  gran  medida  de  la  situación  a la  que  se  aplican, 
es  decir,  se  ven  afectados  por  consideraciones  como: 

Conocimiento  de  la  meta,  es  decir,  de  lo  que  se  busca. 

Existencia  de  solución. 

Grado  de  reversibilidad. 

Competitividad:  esta  característica  alcanza  gran  relevancia  en  los  jue- 
gos en  los  que  intervienen  dos  jugadores,  ya  que  es  necesaria  una  estrate- 
gia distinta  de  la  que  se  utilizaría  en  rompecabezas  o juegos  contra  la  na- 
turaleza, es  decir,  sin  adversario. 

Medida  del  progreso  hacia  la  meta. 

Existencia  de  restricciones. 
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BUSQUEDA  EN  GRAFOS 


Los  grafos  son  sistemas  de  representación  de  información  muv  utiliza- 
dos en  1A,  y muy  adecuados  a la  representación  de  juegos,  ya  que  permi 
en  operar  fácilmente  con  los  estados  o situaciones  que  se  alcanzan  en  el 
transcurso  de  las  jugadas,  así  como  averiguar  sus  relaciones  de  dependen 
cía,  sus  conexiones  directas  e indirectas,  etc. 

Existen  múltiples  variaciones  de  los  procedimientos  de  búsqueda  en  un 
grafo,  pero  todos  ellos  pueden  representarse  de  forma  general  mediante 
un  procedimiento,  que  puede  describirse  informalmente  como  sigue: 

• a1.  U"  Sní°  d,C  bús?ucda  G*  constando  solamente  del  nodo  ini- 

cia] i.  Colocar  i en  una  lista  demomnada  ABIERTA 

i r£?nUna  CERRADA,  que  m, cimente  está  vacia. 

3.  CICLO,  si  ABIERTA  está  vacia,  salir  con  fracaso. 

4.  Seleccionar  el  primer  nodo  de  ABIERTA,  eliminarlo  de  ABIERTA 
y colocarlo  en  CERRADA.  Llamar  a este  nodo  n. 

5.  Si  n es  un  nodo  meta,  salir  con  éxito,  con  la  solución  obtenida  tra- 
zando un  camino  a i mediante  los  direccionadores  en  G. 

6.  Desarrollar  el  nodo  n.  generando  el  conjunto  S de  sus  sucesores 
que  no  sean  a su  vez  antecesores.  Colocar  estos  miembros  de  S como  su- 
ccsores  de  n en  el  grafo  G. 

7.  Establecer  desde  cada  uno  de  los  miembros  de  S que  no  estén  yo 

!n«¿í?C<:,0n*d0rCS  a n:  cs  decir‘  desdc  aquellos  que  no  estén  ni  en 
ABIERTA  m en  CERRADA.  Añadir  estos  miembros  de  S a ABIERTA  Para 
cada  miembro  de  S que  ya  estuviera  en  ABIERTA  o CERRADA,  decidir  si 
se  redireccionan  o no  los  punteros  dirigidos  a n.  Para  cada  miembro  de  S 
que  ya  estufera  en  CERRADA,  decidir,  para  cada  uno  de  sus  sucesores  en 
G,  si  se  redireccionan  o no  sus  punteros. 

8.  Reordenar  la  lista  ABIERTA,  bien  conforme  . algún  «quema  arb¡. 
trano,  bien  conforme  a algún  mérito  heurístico 

9.  Ir  a CICLO. 

Este  procedimiento  tiene  la  generalidad  suficiente  como  para  abarcar 
una  amplia  variedad  de  algoritmos  especiales  de  búsqueda  en  grafos  Ge- 
nera un  grafo  explícito  G denominado  -grafo  de  búsqueda-  y un  subcon- 
junto A de  G denominado  «árbol  de  búsqueda-,  que  es  el  que  viene  deter- 
minado por  los  direccionadores  o punteros  que  se  instalan  en  el  grafo 

El  paso  mas  importante  del  procedimiento  es  el  paso  número  8 En  él 
se  ordenan  los  nodos  de  la  lista  ABIERTA  de  tal  manera  que  el  -mejor-  de 
ellos  es  c que  se  selecciona  para  desarrollarlo  a continuación  en  el  paso 
4.  De  la  elección  correcta  o incorrecta  del  orden  de  desarrollo  de  los  no- 
dos del  grafo  depende  en  gran  medida  la  eficiencia  del  procedimiento  Por 


ÍO 


ello,  es  necesario  poner  un  especial  cuidado  en  la  ordenación  que  en  este 
punto  ha  de  realizarse. 

Siempre  que  el  nodo  seleccionado  para  su  expansión  sea  un  nodo  meta, 
el  proceso  termina  con  éxito.  Entonces  el  camino  que  lleva  a él  desde  el 
nodo  inicial,  es  decir,  la  solución  del  problema  (o  la  secuencia  de  jugadas  o 
movimientos  que  han  de  hacerse  para  ganar  en  un  juego),  puede  hallarse  si- 
guiendo la  pista  de  los  apuntadores  o direccionadores  en  orden  inverso. 

El  paso  7 cs  el  encargado  de  asegurar  la  no  repetición  de  caminos  de 
búsqueda  idénticos,  que  restarían  efectividad  y rapidez  al  procedimiento. 
Si  el  grafo  implícito  en  que  se  busca  es  un  árbol,  se  puede  estar  seguro  de 
que  ninguno  de  los  sucesores  generados  en  el  paso  6 se  generó  previamen- 
te en  otra  iteración.  Este  cs  un  caso  especial  en  el  que  no  seria  necesaria 
la  comprobación,  ya  que  no  existirían  nodos  sucesores  de  otro  que  pudie- 
ran ser  a su  vez  antecesores  del  mismo. 

Si  el  grafo  sobre  el  que  se  realiza  la  búsqueda  no  es  un  árbol,  cs  posi- 
ble que  algunos  de  los  miembros  del  conjunto  S ya  hayan  sido  generados, 
es  decir,  estén  ya  en  ABIERTA  o en  CERRADA  Si  se  continúa  el  algoritmo 
sin  imponer  la  comprobación  de  si  alguno  de  los  nodos  ya  ha  sido  gene- 
rado anteriormente,  el  árbol  de  búsqueda  que  se  genera  contiene  varios 
nodos  iguales,  lo  que  aumenta  el  tamaño  del  grafo.  Suele  resultar  más  ba- 
rato realizar  la  comprobación  de  la  identidad  de  los  nodos  que  examinar 
un  enorme  grafo  con  nodos  repetidos.  El  procedimiento  que  se  ha  expues- 
to realiza  esta  comprobación,  ya  que  sólo  añade  a la  lista  ABIERTA  para 
su  posterior  expansión  los  nodos  del  conjunto  S que  no  están  ya  instala- 
dos ni  en  la  propia  lista  ABIERTA  ni  en  la  lista  CERRADA. 

La  misión  de  los  direccionadores  o punteros  es  la  de  crear  el  árbol  de 
búsqueda.  Este  debe  conservar  el  camino  de  menor  coste  encontrado  has- 
ta el  momento  desde  i a cualquier  nodo.  Cuando  al  expandir  nuevos  no- 
dos se  encuentra  un  camino  de  coste  menor,  se  cambian  los  punteros  para 
registrarlo  como  el  nuevo  camino  de  menor  coste.  El  coste  de  un  camino 
se  calcula  por  medio  de  la  suma  de  los  costes  asociados  a cada  uno  de  los 
arcos  que  lo  forman.  En  los  casos  en  que  no  existen  costes  asociados  a los 
arcos,  el  coste  de  un  arco  se  considera  unitario. 

Existe  una  variación  del  procedimiento  que  no  genera  todos  los  suce- 
sores de  un  nodo  a la  vez.  El  procedimiento  modificado  genera  sólo  un  su- 
cesor cada  vez,  es  decir,  no  coloca  un  nodo  en  la  lista  CERRADA  hasta  que 
se  han  generado  todos  sus  sucesores.  Esta  modificación  tiene  gran  utili- 
dad en  algunas  aplicaciones  específicas  de  1A. 


H BUSQUEDA  EN  PROFUNDIDAD 

La  técnica  de  búsqueda  en  profundidad,  denominada  también  búsque- 
da lexicográfica  canónica,  consiste  en  dar  prioridad  a los  nodos  de  niveles 
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g^SSSBSS 

Una  forma  de  implcmentación  de  este  procedimiento  a Dartir  <\*\ 
ABIERTA ' °camberaI  M CXpUCSl°  Cs  ,a  dc  variar  ,a  estructura  de  la  lista 

^r^r°  ge¡,en,füfmis  ™«t 
g.™  s quc  * de“rroi,'n-  “ ~ 

U definición  informal  del  procedimiento  puede  Ser  como  ,igue 

2 & abimtÍ1"'  de  nivf‘-  Po?'r  cl  nodo  “ abierta. 

continué  ““  ”lir  con  En  caso  contrario. 

DA.  Uam^L^e  „n^o°ne  '* pih  AB,ERTA > P-**  • CERRA- 

4.  Si  el  nivel  del  nodo  n cs  igual  ai  limite  de  nivel  borrar  CERRAns 
c ir  al  punto  En  caso  contrario,  continuar.  CERRADA 

u n<Tu  n 'd  i rec c i o nado  r íi  acia*^  ^ ^ B I ER  T A ^y  as  i g na  a e-ada 

-a£S=í=r»-affSi^ 

ABIERTA  y dim^naT  CERR^^**0™*  “ finaJ  SÍ"  ¿XÍI°'  c,iminar,° 

8.  Ir  a 2. 

Por  ejemplo  si  se  considera  el  árbol  de  búsqueda  de  la  fiaura  1 el  nro 
se  oonK^mtmtTptif"  **!"*  pe"«!roso  “ 
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lundidad  cuando  la  solución  se  encuentra  mucho  más  cerca  del  comienzo 
del  grafo.  Pasa  subsanar  en  lo  posible  estos  problemas  se  utiliza  un  límite 
de  nivel,  que  una  vez  alcanzado  detiene  el  proceso  de  búsqueda  evitando 
su  prolongación  infinita. 

Este  procedimiento  es  bastante  económico  en  lo  que  se  refiere  a alma- 
cenamiento en  memoria.  La  memoria  máxima  necesaria  para  su  ejecución 
no  excede  del  producto  del  limite  dc  nivel  por  el  factor  de  ramificación 
del  grafo. 


BUSQUEDA  EN  AMPLITUD 

El  procedimiento  de  búsqueda  en  amplitud  recorre  el  grafo  por  nive- 
les, examinando  todos  los  nodos  de  un  nivel  antes  de  pasar  al  siguiente. 
Su  estructura  es  similar  a la  del  algoritmo  de  búsqueda  en  profundidad, 
sólo  difieren  en  la  ordenación  que  se  hace  de  los  nodos  en  ABIERTA,  que 
en  este  caso  tiene  estructura  de  lista.  La  expresión  del  algoritmo  es  la 
siguiente: 

1.  Colocar  cl  nodo  inicial  en  ABIERTA. 

2.  Si  ABIERTA  está  vacía,  salir  con  fracaso.  En  caso  contrario, 
continuar. 

3.  Eliminar  cl  primer  nodo  de  ABIERTA  y pasarlo  a CERRADA.  Lla- 
mar a este  nodo  n. 

4.  Desarrollar  n,  generando  todos  sus  sucesores.  Asignar  a cada  uno 
un  direccionador  hacia  n. 

5.  Añadir  dichos  sucesores  al  final  dc  ABIERTA. 

6.  Si  el  primer  nodo  de  ABIERTA  cs  un  nodo  meta,  terminar  con  la 


Fig.  /. 
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solución  obtenida  retrocediendo  por  medio  de  los  punteros.  En  caso  con- 
trario, continuar. 

.hi7„*  el  Primer  d'  ABIERTA  es  final  sin  éxito,  eliminarlo  de 
ABIERTA  y eliminar  CERRADA. 

8.  Ir  a 2. 

, ÍdÍ^«EaC<,C  obscrTarsc'  aA*diendo  los  sucesores  de  cada  nodo  al  final 
de  ABIERTA,  van  quedando  por  delante  los  nodos  de  menor  profundidad, 
que  son  los  que  se  van  a desarrollar  preferentemente. 

Por  ejemplo,  si  se  considera  el  árbol  de  búsqueda  de  la  figura  I.  el  pro- 
cedimiento de  búsqueda  en  amplitud  visitaría  los  nodos  en  el  orden  si- 
guiente: A,  B.  C,  D.  E,  F,  G,  H,  I,  J.  K. 

U búsqueda  en  amplitud  no  presenta  los  problemas  de  la  búsqueda  de 
P°r  ° qUC  puede  uti,l2arse  incluso  en  árboles  v grafos  de  pro- 
fundidad infinita.  Encuentra  la  solución  óptima  al  problema,  entendiendo 
como  tal  la  que  se  encuentra  más  cerca  del  punto  de  partida,  que  es  a su 
vez,  la  de  mínimo  coste.  s 1 u 

Fácilmente  puede  deducirse  que  este  procedimiento  no  resulta  muy 
uní  en  los  casos  en  que  todos  los  caminos  conducen  al  nodo  final  más  o 
menos  con  el  mismo  nivel.  Es  un  procedimiento  bastante  eficiente,  aun 
que  tiene  la  desventaja  de  necesitar  una  gran  cantidad  de  almacenamiento 
en  memoria. 

Dada  la  importancia  y amplia  utilización  de  los  dos  procedimientos  que 
se  acaban  de  ver,  amplitud  y profundidad,  han  sido  estudiados  en  conjun- 
to y se  ha  contrastado  su  funcionamiento  para  situaciones  similares.  No 
existe  un  acuerdo  total  entre  los  distintos  especialistas  sobre  las  ventajas 
e inconvenientes  de  cada  uno  de  los  métodos,  aunque  se  pueden  extraer 
conclusiones  bastante  compartidas,  que  son  las  que  se  van  a exponer  a 
continuación. 

En  lo  que  se  refiere  al  procedimiento  de  búsqueda  en  profundidad,  pue- 
den contarse  entre  sus  ventajas  su  gran  rapidez  en  los  casos  en  que  las  so- 
luciones se  encuentran  en  un  nivel  alejado  de  la  raíz,  además,  como  pue- 
de comprobarse  en  la  definición  del  procedimiento,  éste  coloca  pocos  no- 
dos en  ABIERTA,  y no  mantiene  en  memoria  grandes  cantidades  de  infor- 
mación a la  vez.  características  muy  importantes  desde  el  punto  de  vista 
del  coste  computacionai. 

El  procedimiento  de  búsqueda  en  amplitud  ofrece  importantes  venta 
jas  de  optimización,  gestión  de  memoria,  tiempo  de  explotación,  etc.  Es  es- 
pecialmente ventajoso  en  problemas  con  un  alto  grado  de  irreversibilidad 
o prácticamente  irreversibles. 

En  general,  ambos  procedimientos  son  aplicables  y,  salvo  en  casos  ex- 
tremos muy  particulares,  sus  prestaciones  resultan  bastante  similares. 
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BUSQUEDA  CON  VUELTA  ATRAS 


En  gran  parte  de  los  problemas  que  se  presentan  en  IA,  y particular- 
mente a la  hora  de  abordar  la  programación  de  un  juego,  se  plantean  si- 
tuaciones en  las  que  ha  de  tomarse  una  decisión  eligiendo  sólo  una  entre 
varías  alternativas.  Esta  elección  puede  conducir  a la  meta  deseada  o,  por 
el  contrarío,  puede  conducir  a un  callejón  sin  salida  o a un  fracaso.  En  es- 
tos casos,  por  otra  parte  bastante  frecuentes,  el  programa  debe  disponer 
de  algún  mecanismo  que  le  permita  volver  sobre  las  elecciones  realizadas 
v hacer  otra  elección  diferente  que  pueda  llevarle  al  objetivo  buscado.  Este 
proceso  se  denomina  en  programación  «vuelta  atrás»  o «retroceso».  Tam- 
bién es  bastante  conocida  y utilizada  su  denominación  inglesa  «back- 
tracking». 

Cuando  se  utiliza  este  procedimiento,  cada  vez  que  se  llega  a un  punto 
muerto  o no  se  consigue  alcanzar  la  meta,  se  «desanda»  el  camino  recorri- 
do olvidando  lo  hecho  desde  la  última  toma  de  decisión,  iniciándose  de 
nuevo  el  proceso  tomando  otro  camino  no  utilizado  anteriormente.  Claro 
está  que  el  procedimiento  resultará  tanto  más  eficiente  cuanto  mayor 
acierto  se  tenga  en  la  elección  de  las  distintas  alternativas.  Por  unto,  debe 
buscarse  un  método  de  clasificación  u ordenación  de  las  distintas  posibi- 
lidades de  desarrollo  que  permita  seguir  el  camino  más  prometedor  en 
cada  ocasión. 

Una  formulación  del  algoritmo  de  vuelta  atrás  es  la  que  se  muestra  a 
continuación: 

1.  Colocar  el  nodo  inicial  en  ABIERTA. 

2.  Si  ABIERTA  está  vacia,  salir  con  fracaso.  En  caso  contrarío, 
continuar. 

3.  Examinar  el  primer  nodo  de  ABIERTA  y llamarlo  n. 

4.  Si  el  nivel  de  n es  igual  al  limite  de  nivel,  o si  todas  las  ramas  que 
parten  de  n han  sido  ya  atravesadas,  eliminar  n de  ABIERTA  e ir  a 2.  En 
caso  contrarío,  continuar. 

5.  Generar  un  nuevo  sucesor  de  n,  llamándolo  n'.  Poner  n‘  en  la  cima 
de  ABIERTA  y colocar  un  direccionador  que  apunte  a n. 

6.  Marcar  n para  indicar  que  la  rama  (n  n’)  se  ha  atravesado. 

7.  Si  n’  es  un  nodo  meta,  salir  con  la  solución  obtenida  retrocediendo 
a través  de  direccionadores.  En  otro  caso,  continuar. 

8.  Si  n’  es  final  sin  éxito,  eliminarlo  de  ABIERTA. 

9.  Ir  a 2. 

Este  algoritmo,  tal  como  se  ha  presentado,  es  una  modificación  del  pro- 
cedimiento de  búsqueda  en  profundidad.  Cuando  se  selecciona  un  nodo 
para  ser  explorado  sólo  se  genera  uno  de  sus  sucesores  y éste  se  somete 
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de  nuevo  a exploración,  a menos  que  sea  el  nodo  meta  o un  final  sin  éxito. 
Si  el  nodo  generado  cumple  algún  criterio  de  parada,  el  programa  retro- 
cede al  antecesor  más  cercano  todavía  no  explorado,  esto  es,  el  que  aún 
no  ha  generado  sus  sucesores. 

En  general,  los  criterios  de  parada  que  provocan  la  vuelta  atrás  son: 

— La  generación  de  un  estado  que  ya  hubiera  aparecido  anterior- 
mente. 

— La  realización  de  un  número  previamente  fijado  de  elecciones  sin 
haberse  alcanzado  la  situación  objetivo. 

— La  imposibilidad  de  realizar  otra  nueva  elección  en  el  punto  al  que 
se  ha  regresado. 

— La  imposibilidad  de  llegar  desde  el  estado  actual  al  estado  objetivo. 

Este  procedimiento  consigue  un  mayor  ahorro  de  memoria  que  el  pro- 
cedimiento de  profundidad,  ya  que  no  necesita  almacenar  más  que  el  ca- 
mino que  está  siguiendo  en  esc  momento,  despreciando  el  resto  del  árbol 
de  búsqueda. 

Existen  variaciones  más  sofisticadas  del  algoritmo  de  vuelta  atrás  que 
permiten  realizar  el  retroceso  no  al  nivel  anterior,  sino  a un  punto  situado 
varios  niveles  más  arriba.  Este  procedimiento  se  denomina  «vuelta  atrás 
por  niveles». 

PROCEDIMIENTO  DE  GENERACION 
Y VERIFICACION 

Para  ciertos  problemas  de  características  particulares  los  procedimien- 
tos de  búsqueda  que  ya  se  han  expuesto  no  resultan  adecuados.  A veces  es 
conveniente  realizar  la  búsqueda  dividiendo  el  proceso  en  dos  partes.  La 
primera  consiste  en  la  generación  de  posibles  soluciones,  en  el  caso  de  un 
juego  serían  posibles  situaciones  vencedoras;  y la  segunda  consiste  en  un 
mecanismo  de  verificación  de  dichas  soluciones.  Como  puede  observarse, 
esta  estrategia  es  de  una  gran  simplicidad,  sin  embargo,  no  es  excesiva- 
mente eficiente  en  un  caso  general. 

La  formulación  del  procedimiento  puede  realizarse  de  la  siguiente 
forma: 

1 . Generar  una  posible  solución  al  problema  planteado. 

2.  Verificar  que  esta  solución  es  verdaderamente  una  solución  al  pro- 
blema. La  verificación  suele  hacerse  generalmente  por  comparación. 

3.  Si  la  solución  es  válida,  abandonar  la  búsqueda.  En  caso  contrario, 
ira  1. 

El  procedimiento  encuentra  la  solución  siempre  que  ésta  exista  y que 
la  generación  de  soluciones  se  realice  de  forma  sistemática.  El  grave  in- 
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i (inveniente  de  este  procedimiento  es  su  gran  consumo  de  tiempo,  espe- 
cialmente si  el  espacio  problema  (situaciones  posibles)  es  grande.  Si  se 
i ombina  este  procedimiento  con  otras  técnicas  que  restrinjan  el  espacio 
en  el  que  ha  de  efectuarse  la  búsqueda,  puede  resultar  muy  efectivo.  Una 
técnica  adecuada  para  realizar  esta  combinación  es  la  planificación,  que 
ya  ha  sido  probada  con  excelentes  resultados. 


PROCEDIMIENTO  DE  ESCALADA 

El  procedimiento  de  búsqueda  por  escalada  puede  considerarse  como 
una  variante  de  procedimiento  de  generación  y verificación.  Si  la  función 
de  verificación  se  incrementa  con  una  función  que  proporcione  una  esti- 
mación de  la  proximidad  de  un  estado  cualquiera  al  estado  meta,  el  pro- 
(edtmiento  se  convierte  en  uno  de  escalada.  Con  este  procedimiento  se 
consigue  reducir  el  número  de  secuencias  de  estados  que  hay  que  seguir 
antes  de  encontrar  un  estado  final  haciendo  más  rápido  el  método. 

En  esencia,  el  procedimiento  de  escalada  se  basa  en  la  utilización  de 
una  función  de  evaluación  sobre  todos  los  estados  que  han  de  represen- 
tarse en  la  búsqueda,  incluidos  los  estados  inicial  y meta.  La  función  ha  de 
ser  de  tal  forma  que  alcance  su  mayor  valor  para  el  estado  final  y no  su- 
pere este  valor  máximo  en  ninguno  de  los  estados  intermedios.  Cada  pro- 
blema concreto  requiere  una  función  de  escalada  diferente,  que  el  progra- 
mador  ha  de  elegir  teniendo  en  cuenta  las  características  del  problema 
que  se  trate. 

El  procedimiento,  partiendo  del  estado  inicial,  elige  entre  todos  los  po- 
sibles aquel  estado  al  que  puede  llegarse  en  un  solo  paso  desde  el  inicial 
\ que  tiene  un  valor  mayor  de  la  función  de  evaluación  elegida.  De  esta 
turma  el  procedimiento  «escala»  hacia  la  meta  por  el  camino  de  máxima 
pendiente.  En  caso  de  que  existan  dos  estados  con  el  mismo  valor  de  la  fun- 
ción y éste  sea  máximo,  debe  elegirse  uno  de  ellos,  aun  a riesgo  de  no  ele- 
gir el  correcto.  En  determinados  problemas  puede  ser  de  ayuda  disponer 
de  cierta  información  adicional  que  pueda  determinar  cuál  de  los  dos  ca- 
minos es  el  más  adecuado. 

En  el  ejemplo  de  la  figura  2 puede  observarse  el  camino  seguido  hasta 
llegar  a la  solución  2,  nodo  J.  Como  ya  se  ha  explicado,  el  procedimiento 
elige  en  cada  caso  el  nodo  cuyo  valor  de  la  función  de  evaluación  f es 
mayor. 

Este  método  plantea  algunos  problemas  y,  en  determinados  casos,  no 
alcanza  el  estado  final  en  el  primer  intento.  Aun  asi,  todavía  puede  seguir 
utilizándose  la  escalada,  aunque  realizándose  en  dos  pasos.  Esto  es,  eli- 
giendo la  secuencia  de  dos  pasos  de  acciones  a partir  del  nodo  que  haya 
tenido  el  valor  máximo  de  la  función  de  escalada.  Esta  modificación  re- 
suelve el  problema  en  la  mayoría  de  las  ocasiones. 
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Cuando  el  método  de  escalada  fracasa,  suele  ser  debido  principalmen- 
te a una  elección  equivocada  de  la  función  de  evaluación.  Esta,  en  gene- 
ral, es  una  función  unidimensional,  pero  hay  problemas  en  los  que  la  meta 
difiere  del  estado  inicial  en  vahas  dimensiones  significativas.  En  estos  ca- 
sos resulta  más  adecuada  una  función  de  escalada  multidimensional.  En 
otros  casos  es  posible  guiar  el  procedimiento  en  base  a la  proximidad  a la 
meta  evaluada  sobre  cada  una  de  las  dimensiones  por  separado.  Sin  em- 
bargo, puede  no  ser  fácil  encontrar  una  manera  sencilla  de  combinar  las 
operaciones  sobre  cada  dimensión  en  una  función  de  evaluación  simple 
que  las  englobe.  Si  se  produce  este  caso  ha  de  utilizarse  un  vector  de  eva- 
luación asociado  a cada  estado,  en  lugar  de  un  valor  numérico  único. 


La  estrategia  de  escalada  goza  de  una  gran  popularidad  entre  los  mé- 
todos de  búsqueda,  principalmente  debido  al  escaso  esfuerzo  computacio- 
nal  que  requiere  su  implementación.  El  ahorro  de  esfuerzo  viene  dado  por 
el  hecho  de  que  el  procedimiento  no  tiene  necesidad  de  memorizar  los  in- 
tentos pasados  ni  el  camino  que  conduce  a la  situación  actual. 

Evidentemente,  el  procedimiento  presenta  algunos  fallos.  Es  fácil  y 
ocurre  con  una  cierta  frecuencia,  que  la  escalada  quebrante  el  requisito 
de  sistcmaticidad  de  la  búsqueda,  dejando  algunos  nodos  sin  visitar,  es  de- 
cir. estados  posibles  sin  evaluar.  La  probabilidad  de  que  se  produzca  este 
error  puede  disminuirse  con  la  utilización  de  una  función  de  escalada  muy 
informativa  respecto  al  problema  que  se  trata.  Hay  que  tener  en  cuenta, 
sin  embargo,  que  la  mejora  en  la  función  de  evaluación  puede  conducir  a 
una  búsqueda  a más  profundidad  de  caminos  que  no  llevan  a la  solución. 

Asi,  pues,  la  escalada  es  una  técnica  útil  en  los  casos  en  que  se  posee 
una  función  de  evaluación  altamente  informativa  que  conduzca  rápida- 
mente hacia  la  cumbre  global  en  la  que  se  encuentra  el  estado  meta.  Asi- 
mismo es  útil  cuando  los  operadores  que  se  aplican  para  pasar  de  un  es- 
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lado  a otro  son  independientes,  es  decir,  la  utilización  de  un  operador  no 
impide  la  aplicabilidad  futura  de  los  otros  operadores. 

3 EL  ALGORITMO  A 

Este  algoritmo  es  una  particularización  del  procedimiento  general  de 
búsqueda  en  grafos.  La  particularización  consiste  en  la  forma  especial  en 
que  se  reordenan  los  nodos  en  la  lista  ABIERTA.  Para  la  ordenación  de 
esta  lista  se  utiliza  una  función  de  evaluación  f(.)  cuya  misión  es  la  de  ser- 
vir de  estimador  de  la  suma  del  camino  de  coste  mínimo  desde  el  nodo  ini- 
cial al  que  se  está  considerando  y el  coste  de  un  camino  de  coste  mínimo 
desde  el  nodo  considerado  a un  nodo  meta. 

De  acuerdo  a la  definición  de  esta  función,  se  decide  ordenar  los  no- 
dos de  la  lista  ABIERTA  de  menor  a mayor  valor  de  la  función  de  evalua- 
ción. De  esta  forma  se  expanden  en  primer  lugar  aquellos  nodos  que  pa- 
recen más  prometedores,  es  decir,  los  que  forman  un  camino  de  coste 
minimo. 

Evidentemente,  en  la  utilización  del  algoritmo  sobre  un  grafo  concre- 
to no  es  posible  utilizar  una  función  de  evaluación  f(.)  exacta  que  incorpo- 
re en  su  cálculo  el  coste  de  un  camino  de  coste  minimo  desde  un  nodo 
c ualquiera  a un  nodo  meta.  Si  asi  fuera,  se  conocería  el  mejor  camino  has- 
ta la  meta  de  antemano,  situación  en  la  que  no  seria  necesario  ningún  tipo 
de  búsqueda.  Debido  a ello  se  utiliza  una  función  de  evaluación  f(.)  aproxi- 
mada al  valor  real.  Podemos  considerar  esta  función  de  la  siguiente  forma: 

f(.)  - g(  ) + H(.) 

donde: 

— g(.)  es  el  coste  del  camino  en  el  árbol  de  búsqueda  creado  por  el  al- 
goritmo desde  el  nodo  inicial  al  nodo  considerado.  Este  coste  se  calcula 
como  la  suma  de  los  costes  asignados  a cada  uno  de  los  arcos.  En  los  ca- 
sos en  que  no  existe  tal  coste,  se  supone  unitario. 

— h(.)  es  una  función  heurística,  estimador  del  camino  de  coste  mini- 
mo desde  el  nodo  considerado  al  nodo  meta.  Esta  función  depende  de  las 
características  de  cada  problema,  no  existiendo  un  patrón  de  construcción 
de  funciones  de  este  tipo. 

La  eficacia  del  procedimiento  depende  en  gran  medida  del  acierto  en 
la  elección  de  esta  función  heurística  h. 

Si  la  función  h(.)  cumple  la  condición  de  mantenerse  menor  o igual 
que  el  coste  real  desde  el  nodo  a la  meta  para  cada  uno  de  los  nodos  de 
la  búsqueda,  el  algoritmo  se  denomina  A*.  Esta  condición  permite  asegu- 
rar la  admisibilidad  del  algoritmo,  es  decir,  que  la  solución  encontrada  por 
el  algoritmo  es  la  óptima. 
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Existen  multitud  de  fomulaciones  teóricas  sobre  las  propiedades  y ca- 
racterísticas del  algoritmo,  expresadas  la  mayoría  en  forma  de  teoremas. 


= BUSQUEDA  EN  GRAFOS  Y/O 

En  determinados  tipos  de  problemas  existen  relaciones  de  dependen-  I 
cías  especiales  que  no  pueden  representarse  en  los  grafos  que  se  han  es-  I 

tudiado  hasta  ahora.  Estos  problemas  hacen  uso  de  un  tipo  particular  de  I 

grafo.  denominado  Y/O,  o también  grafo  conjuntivo/disyuntivo. 

Un  grafo  de  este  tipo  consta  de  nodos  etiquetados.  Cada  uno  puede  te-  i 

ner  etiqueta  Y o etiqueta  O.  Estas  etiquetas  se  utilizan  para  indicar  la  re-  I 

lación  existente  entre  un  nodo  y sus  sucesores.  Si  un  nodo  tiene  etiqueta 
Y no  puede  ser  resuelto,  a menos  que  lo  sean  también  exactamente  todos 
los  sucesores.  Si,  por  el  contrarío,  está  etiquetado  O,  puede  ser  resuelto  si 
se  resuelve  alguno  de  sus  sucesores. 

La  figura  3 muestra  un  ejemplo  de  un  grafo  Y/O.  Como  puede  obser-  | 
varse,  en  las  representaciones  gráficas  se  utilizá  la  convención  de  no  co- 
locar etiquetas  en  cada  nodo,  representando  los  nodos  Y mediante  un  arco  1 
que  une  las  ramas  que  parten  de  él.  Los  nodos  O no  tienen  esta  marca. 

Los  algoritmos  de  búsqueda  para  grafos  de  este  tipo  no  difieren  mucho 
de  los  utilizados  para  los  grafos  simples.  La  diferencia  estriba  casi  esen- 
cialmente en  la  determinación  de  las  condiciones  de  finalización  de  la  bús- 
queda. Mientras  que  la  condición  de  terminación  para  grafos  normales  de- 
pende sólo  de  las  propiedades  de  un  nodo,  en  los  grafos  Y/O  la  condición 
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luí  de  buscarse  sobre  un  conjunto  de  nodos  teniendo  en  cuenta  sus  rela- 
ciones dentro  del  grafo. 

Se  puede  considerar  que  existen  los  mismos  procedimientos  de  bús- 
queda para  los  dos  tipos  de  grafos.  tales  como  amplitud,  profundidad,  re- 
t roe  eso,  etc.  Sin  embargo,  existe  un  algoritmo  especifico  para  los  grafos 
Y /O,  denominado  algoritmo  AOV  Este  algoritmo,  cuya  estructura  es  prác- 
lu. ámente  igual  a la  del  algoritmo  A*,  utiliza  también  una  función  de  eva- 
luación que  incluye  una  función  heurística  dependiente  del  problema  al 
que  se  destine.  Incorpora  una  función  de  purga  que  elimina  del  árbol  de 
búsqueda  aquellos  nodos  que  no  van  a afectar  al  camino  hasta  entonces 
obtenido.  Esta  purga  puede  resultar  muy  útil,  pero  su  uso  ha  de  ser  caute- 
loso. ya  que  en  determinados  casos  da  lugar  al  abandono  de  caminos  que 
deberían  haber  sido  explorados. 


ESTRATEGIAS  ESPECIALES  PARA  JUEGOS  DE  DOS 
CONTRINCANTES 

Hasta  el  momento  se  han  estudiado  estrategias  y procedimientos  de 
luisqueda  habituales  en  la  resolución  de  problemas  de  Inteligencia  Artifi- 
< tal.  Todos  ellos  son  utilizables  en  la  programación  de  cualquier  juego  que 
pueda  realizar  una  persona.  De  hecho,  muchos  de  los  programas  de  juc 
gos  que  se  presentan  en  este  libro  utilizan  algoritmos  de  búsqueda  como 
los  ya  mencionados.  Suelen  ser  los  juegos  que  se  denominan  -contra  la  na- 
turaleza». es  decir,  sin  adversario.  Sin  embargo,  para  los  tipos  de  juego  en 
los  que  intervienen  dos  jugadores,  parece  que  los  algoritmos  de  búsqueda 
no  dan  un  resultado  demasiado  bueno.  Esto  se  debe  principalmente  a su 
enorme  cantidad  de  posibilidades,  que  hacen  prácticamente  imposible  la 
generación  y examen  exhaustivo  de  todo  el  árbol  de  estados.  Esto  ocurre 
en  juegos  tan  comunes  como  las  damas  o el  ajedrez.  Así,  pues,  el  estudio 
profundo  de  los  juegos  de  este  tipo  condujo  al  desarrollo  de  nuevas  estra- 
tegias de  búsqueda  más  eficientes  en  los  casos  mencionados  que  los  algo- 
ritmos de  búsqueda  convencionales. 

Estos  algoritmos  explotan  las  características  de  los  juegos  entre  adver- 
sarios y perfectamente  informados.  Esto  quiere  decir  que  existen  dos  ju- 
gadores que  alternan  sus  movimientos  y tumos,  y que  en  cada  instante  las 
reglas  del  juego  definen  qué  movimientos  se  permiten  y cuál  será  su  efec- 
to inmediato.  Por  tanto,  no  se  consideran  todos  aquellos  juegos  en  los  que 
intervienen  el  capricho  del  azar,  como  pueden  ser  la  mayor  parte  de  los 
luegos  de  cartas.  La  denominación  de  perfectamente  informados  se  debe 
al  hecho  de  que  cada  jugador  tiene  en  todo  momento  información  total  so- 
bre la  situación  en  que  se  encuentra  su  oponente  y sobre  las  elecciones  a 
las  que  puede  optar  él  mismo. 
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Para  la  representación  de  los  posibles  estados  del  juego  se  utiliza  la  re- 
presentación en  forma  de  grafo,  pero  en  este  caso  el  grafo  adquiere  forma 
de  árbol.  Este  árbol  se  construye  a partir  del  nodo  inicial  o raíz,  que  re- 
presenta la  situación  antes  de  comenzar  el  juego.  Los  sucesores  de  la  raíz 
son  las  posiciones  que  puede  alcanzar  el  primer  jugador  en  un  movimien- 
to. A partir  de  cada  uno  de  ellos  se  generan  sus  sucesores,  que  correspon- 
den a las  situaciones  producidas  por  las  respuestas  posibles  del  segundo 
jugador.  Los  nodos  terminales,  también  denominados  hojas,  representan 
las  situaciones  finales  del  juego  y pueden  etiquetarse  con  el  resultado  ob- 
tenido. es  decir,  GANADOR,  PERDEDOR  o EMPATE.  Si  se  sigue  el  camino 
que  lleva  desde  el  nodo  inicial  a uno  de  los  finales  se  obtendrá  el  desarro- 
llo completo  de  una  partida  de  juego,  incluyendo  el  resultado,  que  viene 
dado  por  la  etiqueta  del  nodo  terminal. 

De  acuerdo  con  esta  representación,  y para  facilitar  la  exposición  de  los 
algoritmos,  se  puede  convenir  en  denominar  al  primer  jugador  MAX  y al 
segundo  MIN.  Asi,  es  posible  referirse  ai  tumo  del  MAX  o a la  posición  del 
MIN,  entendiendo  con  ello  las  que  corresponden  al  primer  y segundo  ju- 
gador, respectivamente.  Por  supuesto,  los  árboles,  que  representan  los  jue- 
gos contienen  dos  tipos  de  nodos:  nodos  MAX  y nodos  MIN.  La  figura  4 
muestra  un  árbol  de  este  tipo. 

La  resolución  de  un  árbol  con  esta  estructura  consiste  en  el  etiquetado 
de  nodo  raíz  con  una  de  las  situaciones  finales  posibles.  GANADOR,  PER 
DEDOR  o EMPATE  Para  cada  etiqueta  de  la  raíz  existe  una  estrategia  óp- 
tima de  juego  que  asegura  esa  situación  final  independientemente  de  la  for- 
ma en  que  juegue  el  contrario.  Las  estrategias  pueden  definirse  en  función 
de  subárboles  del  árbol  original  del  juego,  pudiendo  definirse  estrategias 
para  los  dos  jugadores,  es  decir,  tanto  para  MAX  como  para  MIN.  De  todas 
las  estrategias  definibles  tienen  especial  interés  las  denominadas  «estrate- 
gias ganadoras»,  que  aseguran  la  etiqueta  GANADOR  para  la  raíz  indepen- 
dientemente de  cómo  juegue  el  oponente. 

La  teoría  general  existente  sobre  árboles  y grafos  aplicada  a este  caso 
conduce  a resultados  teóricos  muy  interesantes  y de  gran  importancia, 
pero  que  rebasan  las  pretensiones  de  este  libro. 

Aunque  esta  forma  de  representación  resulta  muy  adecuada  y compac- 
ta, parece  obvio  que  en  la  mayoría  de  lo  juegos  es  demasiado  larga  la  ge- 
neración completa  del  árbol  con  el  objeto  de  llegar  a etiquetar  sus  nodos 
terminales  y evaluar  luego  los  nodos  de  forma  ascendente  para  decidir 
en  cada  paso  el  movimiento  óptimo,  que  es  el  que  sigue  el  camino  halla- 
do. Por  ejemplo,  un  árbol  completo  para  el  juego  de  las  damas  puede  te- 
ner sobre  unos  1040  nodos  no  terminales,  cifra  prácticamente  imposible  de 
alcanzar,  ni  siquiera  con  la  capacidad  de  un  ordenador  moderno. 

Evidentemente,  resulta  absurdo  pretender  una  generación  exhaustiva 
del  árbol  del  juego.  Incluso  si  se  conociera  una  estrategia  de  juego  en  tér- 
minos de  las  respuestas  adecuadas  para  cada  movimiento  del  contrario,  el 
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□ NODO  MAX 
NODO  MIN 

Fig  4. 

numero  de  nodos  que  debería  contener  el  árbol  seria  del  orden  de  la  raíz 
cuadrada  del  número  total  de  nodos.  Para  el  caso  visto  anteriormente,  la 
cifra  ascendería  a 1020.  todavía  intratable.  Por  tanto,  debe  abandonarse  la 
idea  de  encontrar  o retener  una  estrategia  que  ofrezca  garantía  absoluta 
del  éxito  del  juego. 

Las  estrategias  que  trabajan  con  árboles  de  juegos  no  consideran  el  ár- 
bol completo.  Sólo  extienden  el  árbol  hasta  un  determinado  nivel.  Los  no- 
dos de  este  nivel,  que  en  el  árbol  completo  serian  los  nodos  terminales,  se 
denominan  nodos  frontera  de  la  búsqueda. 

Existen  diferentes  estrategias  de  búsqueda  en  un  árbol  de  juego,  pero 
la  mayoría  se  basan  en  la  utilización  de  funciones  de  evaluación  de  las  po- 
sibilidades de  cada  movimiento  (análogas  a las  funciones  de  evaluación  de 
los  algoritmos  de  búsqueda  anteriormente  estudiados),  y en  la  aplicación 
de  la  Regla  Minimax.  Esta  regla  consiste  en  un  procedimiento  de  asigna 
ción  de  valor  a los  nodos  de  un  árbol.  La  formulación  del  procedimiento 
es  la  siguiente: 

|.  Si  el  nodo  J está  situado  en  la  frontera  de  búsqueda,  su  valor  V(J) 
es  igual  al  valor  de  la  función  de  evaluación  para  dicho  nodo,  es  decir. 
V(J)  - e(J);  de  lo  contrario: 

2.  Si  J es  un  nodo  MAX,  V(J)  es  igual  al  valor  máximo  de  cualquiera 
de  sus  sucesores. 
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3.  Si  J es  un  nodo  MIN.  V(J)  es  igual  al  valor  mínimo  de  cualquiera 
de  sus  sucesores. 

Este  procedimiento  se  basa  en  dos  heurísticas;  la  primera  se  utiliza  en 
el  cálculo  de  la  función  de  evaluación  c(J).  Esta  función  realiza  una  esti- 
mación de  la  solidez  de  una  determinada  posición  del  juego  tomando  en 
cuenta  sólo  sus  características  estáticas.  La  segunda  heurística  se  utiliza 
en  el  cálculo  de  los  valores  de  los  nodos,  realizándolo  como  si  los  nodos 
frontera  fueran  verdaderos  nodos  terminales,  es  decir,  como  si  se  estuvie- 
ra examinando  el  árbol  completo.  Si  la  primera  heurística  resulta  correc- 
ta. la  segunda  propaga  los  valores  de  forma  exacta.  Sin  embargo,  si  la  fun- 
ción de  evaluación  es  sólo  una  estimación  no  muy  acertada  del  valor  real, 
la  regla  de  propagación  no  funciona  tan  eficazmente. 

Es  conveniente  la  utilización  combinada  de  los  dos  tipos  de  evaluación 
(evaluación  estática  mediante  la  función  e.  y propagación  dinámica  del  va- 
lor), va  que  el  valor  obtenido  resulta  ser  una  estimación  más  exacta  de  los 
verdaderos  valores  de  los  movimientos  posibles  para  el  jugador  MAX.  que 
el  valor  resultante  de  aplicar  la  función  estática  de  evaluación  a esos  mis- 
mos movimientos  sin  evaluar  sus  consecuencias. 


ESTRATEGIA  MINIMAX 

La  estrategia  mimmax  es  una  estrategia  de  búsqueda  exhaustiva.  Su  ven- 
taja frente  a una  estrategia  de  búsqueda  de  las  que  ya  se  han  visto  es  que 
no  estudia  el  árbol  completo.  Elige  siempre,  en  una  situación  determina- 
da. la  «mejor  primera  jugada»,  esperando  la  respuesta  del  adversario  y vol- 
viendo a decidir  en  consecuencia. 

El  procedimiento  define  el  estado  de  un  nodo  J y su  valor  minimax  V(J) 
mediante  un  proceso  de  inducción  descendente  que  puede  transformarse 
de  forma  sencilla  en  un  procedimiento  de  búsqueda  recursivo.  Una  posi- 
ble formulación  del  algoritmo  puede  ser: 

MINIMAX  (versión  en  profundidad) 

1.  Si  J es  un  nodo  terminal,  devolver  V(J)  • e(J);  de  lo  contrario: 

2.  Generar  los  sucesores  de  J,  J„  J,.  ... 

3.  Evaluar  V(J,).  V(Jj) V(J^)  de  izquierda  a derecha. 

4.  Si  J es  un  nodo  MAX,  devolver  V(J)  - max  fV(J,) VíJh)]. 

5.  Si  J es  un  nodo  MIN,  devolver  V(J)  - min  [V(J,) V(Jb)]. 

Este  procedimiento  recorre  el  árbol  de  búsqueda  de  izquierda  a dere- 
cha en  forma  de  algoritmo  de  búsqueda  en  profundidad.  El  gasto  de  alma- 
cenamiento en  memoria  no  es  excesivo,  ya  que  pueden  generarse  y eva- 
luarse los  sucesores  de  cada  nodo  de  uno  en  uno  y actualizar  el  nodo  pa- 
dre cada  vez  que  se  evalúa  uno  de  sus  nodos  hijo.  Esta  forma  de  evalua- 
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i ión  es  más  económica  que  la  generación  de  todos  los  sucesores  a la  vez, 
que  obliga  a mantenerlos  en  memoria  hasta  que  se  ha  obtenido  su  valor. 

También  puede  escribirse  una  versión  del  procedimiento  que  utilice  re- 
troceso. Tendría  la  siguiente  forma: 

MINIMAX  (versión  con  retroceso) 

1.  Si  J es  un  nodo  terminal,  devolver  V(J)  - e(J);  de  lo  contrario: 

2.  Para  k - 1.  2 b hacer: 

a.  Generar  el  k-ósimo  sucesor  de  J.  llamarlo  Jk. 

b.  Evaluar  V(J  J. 

c.  Si  k - 1 , asignar  CV(J)  — V(J,) 

De  lo  contrario,  para  ki2: 

asignar  CV(J)  -max  [CV(J) V(JJ]  si  J es  MAX  o 

asignar  CV(J)  -min  [CV(J) V(JJ]  si  J es  MIN. 

3.  Devolver  V(J)  - CV(J). 

En  el  algoritmo,  la  variable  CV(J)  representa  el  valor  actualizado  para 
el  nodo  J.  Este  procedimiento  incorpora  también  recursividad,  ya  que  el 
paso  2 (b)  puede  realizarse  mediante  una  llamada  recursiva  a la  función 
MINIMAX. 

El  procedimiento,  tal  como  ha  sido  planteado,  es  exhaustivo,  es  decir 
explora  todos  los  nodos  del  árbol.  Pueden  realizarse  versiones  no  exhaus- 
tivas, que  pasen  por  alto  los  nodos  que  no  proporcionan  información  útil. 
Una  forma  de  ver  esto  es  la  formulación  del  procedimiento  de  resolución 
de  un  árbol  de  juego  muy  sencillo  en  el  que  los  nodos  terminales  sólo  tie- 
nen dos  valores  posibles,  es  decir,  e(J)  puede  tomar  sólo  uno  de  los  valo- 
res GANADOR  o PERDEDOR.  El  procedimiento  se  denomina  RESOLVER 

RESOLVER 

1.  Si  J es  un  nodo  terminal,  devolver  su  estado  directamente;  de  lo 
contrario: 

2.  Comenzar  la  resolución  de  los  sucesores  de  J de  izquierda  a dere- 
cha (llamando  a RESOLVER  recursivamentc). 

3 Si  J es  un  nodo  MAX,  devolver  GANADOR  tan  pronto  como  se  en- 
cuentre un  sucesor  que  sea  GANADOR;  devolver  PERDEDOR  si  todos  los 
sucesores  de  J son  PERDEDOR. 

4 Si  J es  un  nodo  MIN,  devolver  PERDEDOR  tan  pronto  como  se  en- 
cuentre un  sucesor  que  sea  PERDEDOR;  devolver  GANADOR  si  todos  los 
sucesores  de  J son  PERDEDOR. 

5.  Si  J es  un  nodo  MIN,  devolver  PERDEDOR  tan  pronto  como  se  en- 
cuentre un  sucesor  que  sea  PERDEDOR;  devolver  GANADOR  si  todos  los 
sucesores  de  J son  GANADOR. 

Este  procedimiento  puede  implementarse.  con  ligeras  modificaciones, 
para  juegos  con  valores  múltiples  de  la  función  de  evaluación  estática  o in- 
cluso para  valores  continuos  de  la  misma. 
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ALGORITMO  DE  PODA  ALFA-BETA 


El  algoritmo  alfa-beta  es  el  más  utilizado  en  las  aplicaciones  referidas 
a juegos,  dada  su  excepcional  utilidad  en  el  aumento  de  la  velocidad  de  la 
búsqueda  sin  producir  pérdidas  de  información.  Él  algoritmo  determina 
el  valor  mimrnax  de  la  raíz  en  el  árbol  del  juego,  acorriéndolo  en  orden 
predeterminado,  por  ejemplo,  de  izquierdas  derecha,  y desechando  los  no- 
dos  que  no  puedan  afectar  ai  valor  mínima*  de  la  raíz  El  nombre  de 
.poda,  se  debe  precisamente  a que  deja  nodos  sin  examinar,  cortando  ca- 
minos que  no  aportan  ninguna  información  útil.  De  esta  forma  también  se 
aumenta  considerablemente  la  velocidad  de  la  búsqueda,  evitando  la  ex- 
pansión y evaluación  de  nodos  no  útiles. 

El  esquema  de  la  poda  puede  resumirse  de  la  siguiente  forma: 

Realizar  la  versión  de  MINIMAX  con  retroceso  con  una  excepción:  si 
en  el  proceso  de  actualización  del  valor  mimma*  de  un  nodo  este  valor 
pasa  de  un  cierto  limite  prefijado,  no  es  necesario  continuar  la  explora- 
ción por  debajo  de  ese  nodo.  Su  valor  almacenado  en  la  variable  CV  pue- 
de entonces  transmitirse  a su  nodo  padre  como  si  va  se  hubieran  evaluado 
todos  sus  hijos. 

Como  puede  verse,  el  algoritmo  esiablece  un  Valor  frontera,  a pan  ir 
del  cual  considera  que  el  valor  de  los  nodos  sucesores  no  afecta  al  valor 
que  se  va  a obtener  para  el  nodo  padre.  De  esta  forma  puede  olvidar  todos 
Jos  nodos  que  parten  desde  el  que  se  está  evaluando  hacia  abajo.  El  algo- 
ritmo considera  dos  valores  límite,  denominados  alfa  (aj  y beta  0),  uno  in- 
ferior y otro  superior.  Estos  valores  de  corte  se  ajustan  de  forma  dinámica 
a medida  que  avanza  la  ejecución  del  algoritmo  y se  transmiten  de  arnba 
a abajo  como  sigue: 

1 Limite  a:  el  valor  de  corte  para  un  nodo  MIN  es  un  límite  inferior, 
denominado  alfa,  igual  a|  valor  más  alto  de  los  antecesores  MAX  de  dicho 
nodo.  En  d momento  en  que  d valor  de  la  variable  CV  del  nodo  eonside 
rado  igual  o sea  menor  que  alfa,  puede  abandonarse  su  evaluación 

2,  Límite  el  valor  de  corte  para  un  nodo  MAX  es  un  limite  supe- 
rior, denominado  beta,  igual  al  valor  mínimo  de  todos  los  antecesores  MSN 
de  dicho  nodo.  En  el  momento  en  que  d valor  de  la  variable  CV  del  nodo 
considerado  iguale  o sea  mayor  que  beta,  puede  abandonarse  su  eva- 
luación. 

Las  operaciones  de  poda  y actualización  de  los  límites  pueden  repre- 
sentarse median ie  un  procedimiento  recursívp  a]  que  se  puede  denominar 
(J;o,p).  Este  procedimiento  toma  dos  parámetros  a y p,  que  deben  cum- 
plir la  condición  a<p  y devuelve  V(J),  el  valor  mínima*  del  nodo  J si  éste 


se  encuentra  entre  los  valores  límite  a y §.  Si  no  se  cumple  esta  última  con- 
dición, devuelve  a si  V(J)Sa  o |1  si  V(í)£§, 

El  algoritmo  puede  expresarse  de  la  siguiente  forma: 

1 . Si  i es  un  nodo  terminal,  devolver  V(J)  - e(J),  De  lo  contrario,  sean 

ílF  i, Jb  los  sucesores  de  J.  Asignar  k^l.  si  J es  un  nodo  MAX.  ir  al 

paso  2:  si  no,  ir  al  paso  2'- 

2.  Asignar  a*-max  [a,  V(Jt;  a.  0)1, 

2'.  Asignar  0— min  [0;  V(Jk;  a,  0)] 

3.  Si  a£0,  devolver  fr  de  lo  contrario,  continuar, 

y.  Si  pSo,  devolver  a;  de  lo  contrario,  continuar. 

4.  Si  k - b,  devolver  o;  de  lo  contrarío,  proceder  con  Jwt,  es  decir, 
asignar  k*-k  + 1 y pasar  a 2. 

4\  Si  k - b,  devolver  ft,  de  Id  contrario,  proceder  con  IH,  es  decir, 
asignar  k^k  + 1 y pasar  a 2\ 

La  eficiencia  de  este  método  de  búsqueda  depende  de  ía  ordenación 
de  ios  valores  terminales.  En  juegos  complejos,  la  diferencia  entre  el  caso 
mejor  y el  peor  puede  llegar  a ser  importante,  duplicando  la  profundidad 
del  árbol  descendente  que  ha  de  explorarse. 

El  análisis  del  comportamiento  del  algoritmo  alfa  beta  demuestra  que 
permite  extender  la  profundidad  de  la  búsqueda  un  33  por  100  más  que  la 
que  se  utiliza  con  el  procedimiento  MINIMAX  exhaustivo. 

Existen  otros  algoritmos  que  también  son  específicos  de  la  búsqueda 
en  árboles  de  juegos.  De  ellos  los  más  importantes  e interesantes  son:  la 
estrategia  SSS*  y la  estrategia  SCOUT.  Ambos  son  algoritmos  puros  de  bús 
queda  que  examinan  el  árbol  y podan  los  nodos  menos  prometedores  uti- 
lizando para  ello  diferentes  criterios. 

De  todos  ellos  se  han  realizado  estudios  comparativos  cuyas  conclusio- 
nes aconsejan  la  utilización  de  uno  u otro  para  un  determinado  tipo  de  jue- 
gos, desaconsejándola  en  otros  casos. 


m EL  METODO  GPS 

Aunque  no  es  lo  más  usual,  algunos  de  los  problemas  que  se  muestran 
en  este  libro  pueden  ser  resuellos  mediante  otro  tipo  de  técnicas  diferen- 
tes de  las  técnicas  de  búsqueda  anteriormente  descritas.  Uno  de  los  meca- 
nismos que  se  pueden  utilizar  es  el  método  GPS.  Este  método,  cuyo  nom- 
bre proviene  de  General  Problcm  Solver  (Resolutor  General  de  Prob  Le- 
mas}, fue  desarrollado  en  ios  años  sesenta  por  Simón.  Newcl  y Shaw.  Su 
propósito,  como  su  propio  nombre  indica,  era  encontrar  un  procedimien- 
to general  que  pudiera  resoLver  cualquier  tipo  de  problema.  El  método 
tuvo  mucho  éxiio  en  la  época  de  su  creación,  pero  más  tarde  quedó  prác- 
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t'camtim.'  como  objeto  do  estudio,  aunque  impona  mes  panes  de  ¿I  se  han 
utilizado  cottio  base  de  diversa*»  metodologías  posteriores. 

El  método  GPS  plantea  la  búsqueda  de  solución  haciendo  uso  de  lo  que 
se  ha  venido  denominando  -Análisis  de  Medios  Fines*.  Esic  análisis  pro- 
pone la  descomposición  del  problema  original  en  varios  problemas  más 
simples  y sencillos  de  resolver.  Esta  descomposición  se  modélica  median- 
te un  grafo  Y/O.  Asi,  pues,  el  método  consiste  en  tomar  la  solución  como 
un  fin  y buscar  los  medios  que  permitan  llegar  a él.  La  tarea  que  debe  ser 
realizada  por  el  método  debe  estar  represen! ada  en  términos  de  objetos, 
operadores  y diferencias.  En  cada  paso  se  selecciona  un  operador  en  (un- 
ción de  las  diferencias  existentes  entre  el  objeto  actual  y el  deseado.  Los 
operadores  pueden  estar  organizados  de  diferentes  formas,  aunque  lo  más 
usual  es  que  se  encuentren  jerarquizados  en  base  si  tipo  de  diferencias  que 
reducen.  La  elección  del  operador  que  ha  de  utiÜEarse  en  cada  momento 
es  uno  de  los  problemas  Fundamentales  en  la  realización  dd  sistema. 


LOS  SISTEMAS  DE  PRODUCCION 


1 . Introducción 

Tan  pronto  como  se  dieron  los  primeros  pasos  en  el  campo  de  la  IAr 
se  empezó  a cuestionar  la  representación  y tratamiento  que  los  algoritmos 
tradicionales  daban  a los  prob lemas  y a sus  soluciones.  Casi  todos  ios  pro- 
gramas secuencia! es  son.  de  alguna  forma,  dependientes  de  los  datos.  Es- 
pecialmente el  flujo  de  control  y la  uiilización  de  tos  datos  son  fijos,  debi- 
do a la  forma  de  construir  los  programas.  Los  programas  tradicionales  po- 
seen como  característica  esencial  su  secuencia] idad.  Esto  es,  ejecutan  paso 
por  paso  las  instrucciones  del  programa  y siempre  en  el  mismo  orden.  Esto 
no  es  un  inconveniente  para  determinadas  aplicaciones.  Sin  embargo,  no 
es  adecuado  en  situaciones  en  las  que  el  entorno  es  cambiante  v es  nece- 
sario simular  las  respuestas  humanas  a estímulos  provenientes  del  mismo. 

En  estos  casos  es  necesario  que  el  programa  reaccione  a cambios  dei 
entorno.  Si  no  recibe  ningún  estímulo,  debe  avanzar  un  paso  secucne tal- 
mente dependiendo  de  la  historia  del  proceso.  Se  entiende  por  historia  del 
proceso  al  conjunto  de  acciones  que  se  ejecutaron  anteriormente.  En  caso 
de  que  el  entorno  cambie  constantemente,  podrá  ser  útil  dividir  el  progra- 
ma en  una  serie  de  módulos,  cada  uno  de  los  cuales  ha  de  encargarse  de 
tratar  con  ven  ieni  emente  estos  cambios. 

Esto  dio  lugar  a la  idea  de  utilizar  los  datos  como  las  partes  del  progra- 
ma que  dirigen  las  operaciones.  En  esto  radica  la  diferencia  Fundamental 
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con  los  programas  clásicos.  En  éstos,  es  ti  programa  d que  maneja  los 
datos. 

Todas  estas  ideas  Fructificaron  en  la  concepción  de  los  Sistemas  de  Pro- 
ducción que,  en  general,  pertenecen  a una  clase  de  sistemas  denominados 
-Sistemas  de  Inferencia  Dirigidos  por  Patrones-. 


2,  Componentes  de  un  sistema  de  producción 

En  condiciones  normales,  un  Sistema  de  Producción  tiene  tres  compo- 
nentes básicos: 

a)  t/n  conjunto  de  datos  u Base  de  Hechos,  que  contiene  la  informa- 
ción del  mundo,  de!  entorno  y del  programa.  Estos  dalos  se  almacenarán 
en  dicha  Base  de  diferentes  formas,  dependiendo  de  la  estructura  o repre- 
sentación del  conocimiento  que  se  utilice.  Como  ejemplos  se  pueden  citan 

— - En  el  problema  del  -S-Puzzle»  o del  «15-Puzzle*  la  Base  de  Hechos 
estará  formada  por  una  matriz  que  representará  en  cada  momento  la  si- 
tuación del  problema.  También  se  puede  almacenar  en  ella  la  información 
referente  ai  estado  final  o aspectos  referentes  al  aprendizaje. 

— En  el  problema  de  los  misioneros  y los  caníbales  se  puede  utilizar 
una  estructura  en  forma  de  lista  con  tres  elementos:  número  de  misione 

en  una  un  Ha,  número  de  caníbales  en  lo  misma  orilla,  y dónde  sé  en 
eucnira  la  barca.  Esto  último  se  representa  con  una  letra,  como  izquierda 
y derecha,  o por  un  numero,  como  1 izquierda  y 2 derecha. 

Como  puede  observarse,  la  estructura  de  la  Base  y la  forma  en  que 
se  almacenan  los  datos  es  muy  variable  y se  deja  a guslü  del  programador 
el  tipo  de  representación  que  quiera  utilizar.  Esto,  por  supuesto,  tendrá  re- 
percusiones en  los  otros  dos  componentes  del  Sistema  dé  Producción, 
pues  se  tendrán  que  ceñir  en  cierto  modo  a la  estructura  elegida. 

b)  Un  conjunta  de  reglas  o Base  de  Regías.  Contienen  la  mayoría  del 
conocimiento  sobre  la  solución  de  problemas.  Las  reglas,  también  llama- 
das produce  iones,  constan  de  dos  partes:  un  lado  izquierdo,  denominado 
antecédeme  o condición,  y un  lado  derecho,  llamado  consecuente  o de  ac- 
ción. 

La  forma  de  representarlos  gráficamente  es: 

antecedente  consecuente, 
aunque  se  utilizan  muchas  otras  Formas  como: 
condición  — acción, 

b cual  explica  más  sobre  la  filosofía  de  las  reglas,  utilizando  encadena- 
miento hacia  adelante,  el  cual  se  explicará  posteriormente. 
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Si  con  los  datos  disponibles  en  la  Base  de  Hechos  se  cumple  la  condi- 
ción, entonces  se  «ejecuta»  la  parte  derecha  de  acción.  Ello  quiere  decir 
que  se  realizan  las  acciones  especificadas  en  la  parte  derecha.  Estas  acciones 
pueden  tener  muy  diferentes  formas  y representan  la  parte  activa  de  las 
producciones. 

La  forma  general  de  ejecución  de  una  regla  indica  cómo  se  represen- 
tarán comúnmente  en  lenguaje  de  ordenador.  Normalmente,  para  ello  se 
utiliza  la  instrucción: 


IF  condición  THEN  acción, 

presente  en  todos  los  lenguajes.  Tanto  la  parte  de  condición  como  la  parte 
de  acción  pueden  estar  formadas  por  más  de  un  elemento.  Por  ello  se  pue- 
de expresar  también: 

1F  condición,  condición^...  condición,,  THEN  acción,  acción^...  acciónm, 

lo  cual  quiere  expresar  la  idea  de  que  si  se  cumplen  las  condiciones  I,  2. 
...  y n.  se  está  en  condiciones  de  realizar  las  acciones  que  van  de  la  I a la 
m.  Un  ejemplo  de  una  regla  de  este  tipo  podría  ser. 

IF  "Problema  resuelto"  THEN  Parar, 

que  expresa  la  idea  de  que  si  se  llega  al  fin  del  programa,  o bien  al  estado 
final,  se  debe  parar  la  ejecución  del  mismo. 

c)  Una  estrategia  Je  control,  intérprete  de  reglas  o motor  de  inferen - 
cías.  Hasta  ahora  se  ha  definido  la  Base  de  Conocimiento.  Esta  está  forma- 
da por  la  Base  de  Hechos  y la  Base  de  Reglas.  Pero  es  necesario  un  siste- 
ma capaz  de  hacerlos  funcionar.  Esta  es  la  principal  misión  de  la  Estrate- 
gia de  Control.  Es  la  encargada  de  encadenar  los  ciclos  de  trabajo  en  los 
que  se  divide  el  funcionamiento  de  un  Sistema  de  Producción.  Asimismo, 
se  ocupa  de  dirigir  al  sistema  dentro  de  la  ejecución  de  cada  ciclo.  En  su 
caso  más  general,  posee  dos  fases  en  cada  ciclo:  la  fase  de  Decisión  o se- 
lección de  reglas;  y la  de  Acción,  activación,  deducción,  o ejecución  de  las 
reglas  elegidas  para  aplicar.  El  funcionamiento  de  dicha  estrategia  será  tra- 
tado más  adelante,  dentro  de  este  mismo  capitulo. 


= 3.  Tipos  de  sistemas  de  producción 

Basándose  en  la  sintaxis  de  las  reglas  y en  su  estructura  de  control, 
se  pueden  dividir  los  Sistemas  de  Producción  en  dos  tipos: 

a)  Los  sistemas  dirigidos  por  los  antecedentes,  que  son  los  más  utiliza- 
dos. En  éstos,  los  antecedentes  son  condiciones  que  se  han  de  cumplir  para 
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que  se  puedan  ejecutar  los  consecuentes  o acciones.  De  ello  se  deriva  que 
sea  el  antecedente  el  que  gobierne  el  funcionamiento  de  la  regla.  Las  con- 
diciones pueden  ser  meras  verificaciones  de  si  determinados  datos  figuran 
en  la  Base  de  Hechos  o no.  Pero  también  pueden  ser  condiciones  más  com- 
plejas, que  envuelvan  operaciones  con  los  elementos  de  la  Base. 

La  estrategia  utilizada  se  denomina  encadenamiento  hacia  adelante, 
puesto  que  el  sentido  de  la  ejecución  es  el  marcado  por  la  flecha  de  la  re- 
gla. es  decir,  condición-*acción.  Esto  equivale  al  MODUS  PONENS  de  la 
lógica. 

b)  Los  sistemas  dirigidos  por  el  consecuente.  En  este  tipo  tanto  el  an- 
tecedente como  el  consecuente  son  aserciones  acerca  de  los  datos.  La  eje- 
cución de  las  reglas  se  guía  por  los  consecuentes  y retrocede  para  intentar 
probar  los  antecedentes.  Por  ello,  la  estrategia  utilizada  se  denomina  cn- 
i ajenamiento  hacia  atrás.  Esta  estrategia  busca  las  metas  en  los  conse- 
cuentes de  las  reglas  y selecciona  aquellas  reglas  que  las  incluyan.  A con- 
tinuación intenta  demostrar  los  antecedentes  de  las  reglas  encontradas.  Si 
lo  consigue,  el  consecuente  se  puede  alcanzar  y con  él  las  metas.  Debe  ob- 
servarse que  el  sentido  de  ejecución  va  al  contrario  de  los  anteriores  sis- 
temas. En  este  caso  va  de  derecha  a izquierda,  o hacia  atrás.  Este  método 
se  corresponde  con  el  MODUS  TOLLENS  de  la  lógica. 

En  este  capítulo  se  explicará  con  más  detalle  el  funcionamiento  de  es- 
tas dos  estrategias,  incluyendo  un  ejemplo  de  la  primera. 

4.  Funcionamiento  de  un  sistema  de  producción 
en  encadenamiento  hacia  adelante 

Como  ya  se  ha  explicado,  la  estrategia  de  control  posee  el  conocimien- 
to de  control  del  sistema.  Este  control  se  lleva  a cabo  sobre  dos  áreas  del 
funcionamiento:  el  encadenamiento  de  los  ciclos  de  trabajo  en  los  que  se 
divide  el  proceso  de  ejecución  de  un  Sistema  de  Producción,  y las  tareas 
que  han  de  realizarse  dentro  de  cada  ciclo  de  trabajo.  Cuando  se  inicia  la 
ejecución  del  Sistema  de  Producción,  tanto  la  Base  de  Hechos  como  la  de 
Reglas  deben  contener  la  información  y situación  iniciales,  así  como  la 
descripción  de  los  posibles  movimientos  o transiciones  entre  estados.  La 
Estrategia  de  Control,  entonces,  debe  seleccionar  el  primer  ciclo  de  tra- 
bajo y comenzar  su  operación.  Esta  se  divide  en  dos  fases:  Decisión  y Acción. 

a)  Fase  de  Decisión  o selección  de  las  reglas.  Esta  fase  consta  a su  vez 
de  las  siguientes  etapas: 

1)  Etapa  de  Restricción. 

Esta  etapa  intenta  reducir  en  lo  posible  el  número  de  reglas  que  han 
de  ser  examinadas.  Para  ello,  en  la  medida  de  lo  posible,  se  debe  dividir 
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la  Base  de  Reglas  al  principio  del  proceso  en  familias  y subfamilias  de  re- 
glas. Esto  se  debe  realizar  de  modo  que  dentro  de  una  familia  queden  las 
reglas  que  te  apliquen  sobre  un  dominio  similar.  Este  dominio  será  dife- 
rente, de  alguna  forma,  del  dominio  común  referente  a otra  familia  de  re- 
glas. Una  lamilla  se  puede  subdividir  también  en  subfamilias,  v asi  su- 
cesivamente. 3 

Por  ejemplo,  si  el  sistema  trata  de  enfermedades,  será  conveniente  di- 
vidir el  dominio  de  las  enfermedades  en  subdominios.  Asi,  se  podrán  divi- 
dir  las  reglas  en  dominios  de  reglas  que  traten  las  enfermedades  del  estó- 
mago.  las  del  corazón,  etc.  Si  el  dominio  es  el  de  los  juegos,  también  se 
pueden  dividir  las  reglas  en  subdomimos.  Las  reglas  concernientes  a la  sa- 
lida  de  determinados  juegos  como  el  ajedrez  v el  dominó  se  pueden  sepa 
rar  de  las  concernientes  al  desarrollo  normal  del  juego. 

Debido  a estas  divisiones  puede  efectuarse  esta  etapa  de  restricción  En 
ella  se  selecciona  el  dominio  sobre  el  que  se  va  a trabajar  en  cada  ciclo 
Por  tanto,  la  Estrategia  de  Control  trabaja  en  las  etapas  siguientes  con  un 
subconjunto  de  la  Base  de  Reglas,  lo  cual  disminuye  considerablemente  el 
tiempo  de  ejecución. 

Después  de  esta  etapa  y para  el  funcionamiento  del  ciclo  en  que  se  en- 
cuentre la  ejecución  del  sistema,  se  dispondrá  de  una  Base  BR.  igual  o me- 
nor a la  anterior 

BR,  £ BR 

Independientemente  de  esta  división  de  la  Base  de  Reglas,  se  puede  rea- 
lizar también  una  división  de  la  Base  de  Hechos.  Esto  facilitaría  la  tarea 
en  la  etapa  de  equiparación.  Al  dividirla  se  dispondría  de  una  Base  de  He- 
chos BH,  igual  o menor  a la  anterior 

BH,  £ BH 

2)  Etapa  de  Filtrado.  Equiparación  o Cotejo  (-Pattcm  Matching-). 

En  esta  etapa  se  recogen  las  reglas  cuya  parte  de  condición  se  satisface 
con  los  datos  que.  en  ese  momento,  eslieran  en  la  Base  de  Hechos  Para 
ello  se  realiza  la  equiparación  de  las  condiciones  de  las  reglas  con  la  infor- 
mación  contenida  en  la  Base  de  Hechos.  Esto  causa  que  de  la  BR,  (res- 
tricción de  la  Base  de  Reglas  original)  se  pase  a una  nueva  BR,.  también 
llamada  conjunto  conflicto,  tal  que; 

BR,  £ BR, 

Por  tanto,  cuanto  menor  sea  el  número  de  reglas  que  haya  en  BR,,  más 
rápida  se  efectuará  esta  etapa,  ya  que  habrá  que  comprobar  menos  reglas. 

A su  vez.  cuanto  menor  sea  el  número  de  las  reglas  del  conjunto  conflicto 
menos  trabajo  tendrá  que  realizarse  en  la  siguiente  etapa  Por  todo  esto 
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riplica  que  sea  necesario  tener  una  buena  heurística  o información  <i  prio- 
n,  de  forma  que  en  cada  etapa  se  reduzca  considerablemente  el  número 
de  reglas  y hechos  sobre  los  que  se  ha  de  trabajar.  Comúnmente,  esta  eta- 
pa es  la  que  más  recursos  computacionalcs  consume. 

3)  Etapa  de  Resolución  de  Conflictos. 

Con  las  dos  etapas  anteriores  se  ha  logrado  obtener  el  conjunto  de  las 
irglas  que.  en  cada  ciclo,  son  susceptibles  de  aplicación.  Ello  comporta  la 
idea  de  que  se  verifican  todas  las  condiciones  de  cada  regla  y,  por  tanto, 
el  sistema  está  en  condiciones,  está  en  disposición,  de  ejecutar  las  partes 
derechas  de  las  reglas. 

Pero  aún  no  se  ha  llegado  al  final  del  proceso  de  Decisión.  Se  debe  res- 
tringir el  número  de  reglas  a una  o a un  número  muy  bajo.  Esta  decisión 
la  lleva  a cabo  la  Estrategia  de  Control.  Y en  esta  etapa,  fundamentalmen- 
te, es  en  lo  que  difieren  las  diversas  estrategias.  Existen  muchas  opciones, 
métodos  y técnicas.  Algunos  de  los  más  utilizados  son: 

— Ejecutar  la  primera  regla  del  conjunto  conflicto. 

— Ejecutar  la  regla  que  incorpore  más  conocimiento  a la  Base  de  He- 
chos. 

— Ejecutar  la  regla  con  más  prioridad.  Esta  prioridad  la  establecerá  el 
diseñador  del  Sistema  de  Producción.  Vendrá  dada  en  función  de  la  situa- 
ción global  del  sistema  y de  la  importancia  relativa  de  aplicar  una  regla  an- 
tes que  otra. 

— Ejecutar  la  regla  más  específica.  Por  ejemplo,  que  incorpore  las  res- 
tricciones más  fuertes. 

— Ejecutar  la  regla  que  concierne  al  elemento  añadido  más  reciente- 
mente al  contexto  o a la  Base  de  Hechos. 

— Ejecutar  una  nueva  regla,  es  decir,  que  no  se  haya  aplicado  antes  o, 
por  lo  menos,  recientemente.  También  se  podrá  considerar  el  caso  con- 
trano: la  regla  que  más  veces  se  haya  ejecutado. 

Utilizar  una  función  heurística  que  determine  qué  regla  ha  de  apli- 
carse a continuación.  Se  pueden  utilizar  para  ello  algoritmos  que  obten- 
gan caminos  óptimos  entre  la  situación  del  momento  y la  situación  final. 

— Ejecutar  una  regla  arbitraria.  Esto  puede  parecer  poco  efectivo.  Sin 
embargo,  al  terminar  la  segunda  etapa  se  supone  que  las  reglas  pertene- 
cientes al  conjunto  conflicto  son  teóricamente  iguales  desde  el  punto  de 
vista  de  la  posibilidad  de  aplicación. 

— Por  último,  se  pueden  explorar  exhaustivamente  todas  las  alterna- 
tivas posibles  y ejecutar  todas  las  reglas.  Esto  recibiría  un  gran  apoyo  si  se 
dispusiera  de  máquinas  trabajando  en  paralelo. 

Con  esta  etapa  se  ha  concluido  el  análisis  de  la  fase  de  Decisión.  En 
este  momento  se  dispone  de  una  o varias  reglas  que  se  han  de  aplicar. 
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b)  Fase  de  Acción. 

Esta  fase  sólo  comprende  una  etapa  y consiste  en  ejecutar  las  acciones 
especificadas  en  las  partes  derechas  de  las  reglas  elegidas.  Unas  veces  .es- 
tas acciones  se  limitarán  a añadir,  eliminar  o modificar  los  elementos  de 
la  Base  de  Hechos.  Otras  veces  serán  programas  escritos  en  USP  o cual- 
quier otro  lenguaje,  que  permitirán  realizar  funciones  de  cntrada/salida, 
operaciones  numéricas,  etc. 

La  ejecución  del  Sistema  de  Producción  termina  cuando  se  introduce 
en  la  Base  de  Hechos  el  hecho  fijado  como  meta,  o bien  cuando  asi  lo  ex- 
prese la  acción  de  una  de  las  reglas.  En  ocasiones  no  se  alcanza  la  solu- 
ción debido  a que  se  ha  aplicado  una  regla  que  no  lleva  a ningún  sitio.  En 
estos  casos  se  utiliza  la  técnica  de  *backtracking>,  retroceso  o de  marcha 
atrás.  Su  aplicación  significa  que  el  sistema  vuelve  sobre  sus  pasos  hasta 
el  momento  en  el  que  se  eligió  una  regla  del  conjunto  conflicto  antes  que 
otra  u otras.  El  estado  del  sistema  ha  de  ser  el  mismo  que  cuando  se  efec- 
tuó dicha  elección.  A continuación,  se  elige  otra  regla  y se  sigue  el  proceso. 

El  encadenamiento  hacia  adelante  presenta  problemas  como  la  no  id- 
ealización hacia  la  meta.  Para  mejorar  este  aspecto,  ha  de  construirse  una 
Estrategia  de  Control  que  dirija  al  sistema  hacia  la  meta  establecida.  Será 
importante,  por  tanto,  que  en  la  fase  de  Decisión  se  decida  aplicar  la  regla 
que  más  rápido  lleve  a la  solución.  Otro  de  los  inconvenientes  que  presen- 
ta este  tipo  de  estrategia  es  que,  al  principio,  han  de  estar  almacenados  los 
datos  iniciales  en  la  Base  de  Hechos. 


5.  Ejemplo  de  funcionamiento  de  un  Sistema  de 
Producción  en  encadenamiento  hacia  adelante 


El  Sistema  de  Producción  sobre  el  que  basaremos  el  ejemplo  es  el 
siguiente: 

— Base  de  Reglas: 

Estará  formada  por  las  siguientes  reglas: 


I SI  P'  ENTONCES  B.  D\  E' 

2.  SI  A\  B ENTONCES  D\  G# 

3.  SI  A*  ENTONCES  C.  P* 

4 SI  D’.  L ENTONCES  C\  I 

5.  SI  E*  ENTONCES  H,  D 

6.  SI  H’  ENTONCES  L,  A’ 
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la  interpretación  de  estas  reglas  puede  ser  desde  la  identificación  de 
tina  enfermedad  hasta  la  clasificación  de  un  elemento  quimico. 

— Base  de  Hechos: 

Estará  formada  por  los  siguientes  hechos: 

BH  - <H‘,  B,  C,J> 

Tanto  en  la  Base  de  Reglas  como  en  la  Base  de  Hechos  se  toma  la  con- 
vención de  que: 

— las  letras  con  apostrofe  (H’>  son  hipótesis  cuya  certeza  ha  de  demos- 
trarse. 

— las  letras  sin  apóstrofe  (H),  sin  embargo,  son  hechos  ciertos  ya  com- 
probados. 

— Estrategia  de  Control: 

a)  Fase  de  Decisión:  En  este  problema  no  se  va  a efectuar  etapa  de  res- 
tricción. La  etapa  de  equiparación  va  a consistir  en  la  confrontación  de 
los  elementos  de  los  antecedentes  de  las  reglas  con  los  elementos  de  la 
Base  de  Hechos.  De  ella  resultará  el  conjunto  conflicto,  formado  por  las 
reglas  cuyos  antecedentes  pertenecen  por  completo  a la  Base  de  Hechos. 
En  cuanto  a la  etapa  de  resolución  del  conjunto  conflicto  se  explicarán 
dos  de  los  métodos  más  comunes. 

b)  Fase  de  Acción:  Existen  cuatro  posibles  acciones  a ejecutar  con  los 
datos  del  consecuente: 

— Si  en  el  consecuente  de  la  regla  aparece  un  hecho  que  no  pertene- 
ciera ya  a la  Base  de  Hechos,  se  le  incluye  directamente  en  la  misma. 

— Si  un  hecho  aparece  como  cierto  (sin  apóstrofe)  en  el  consecuente 
y en  la  Base  aparece  como  hipótesis  (con  apóstrofe)  se  retirará  de  la  Base 
como  hipótesis  y se  incluirá  como  cierto. 

— Si  un  hecho  aparece  como  hipótesis  en  el  consecuente  de  la  regla 
y como  cierto  en  la  Base  de  Hechos,  no  se  realizará  ninguna  acción. 

— Si  un  hecho  aparece  de  la  misma  forma  en  la  Base  y en  el  conse- 
cuente de  la  regla,  tampoco  se  realizará  ninguna  acción. 

Por  otra  parte,  con  los  elementos  del  antecedente  también  se  realiza 
una  determinada  acción.  Esta  consiste  en  que  si  el  elemento  aparece  como 
hipótesis  en  el  antecedente,  se  eliminará  de  la  Base  de  Hechos. 

Se  supondrá  que  el  proceso  termina  cuando  se  introduzca  el  hecho  H 
en  la  Base  y todos  los  demás  datos  de  la  Base  aparezcan  como  ciertos  en 
ella. 

A continuación  se  detalla  el  funcionamiento  para  dos  técnicas  diferen- 
tes de  resolución  del  conjunto  conflicto. 
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a)  Elección  de  la  primera  regla  del  conjunto  conflicto. 

Primer  ciclo: 

Como  se  ha  dicho,  no  se  va  a considerar  la  etapa  de  restricción  en  este 
ejemplo,  por  lo  que  pasa  directamente  a la  etapa  de  equiparación.  Los  pa- 
sos a ejecutar  serán: 

— Se  escoge  la  primera  regla  SI  P'  ENTONCES  B,  D\  E ‘ y se  observa 
si  los  datos  del  antecedente  pertenecen  a la  Base  de  Hechos.  En  este  caso 
sólo  hay  un  dato,  P',  y no  pertenece  a la  Base.  Debido  a esto  no  se  intro* 
duce  la  regla  I en  el  conjunto  conflicto. 

— Se  realiza  el  mismo  proceso  con  la  regla  2.  Se  comprueba  que  B per- 
tenece a la  Base.  Pero  A*  no  pertenece  a la  Base.  Por  tanto,  tampoco  se  in- 
troduce la  regla  2 en  el  conjunto  conflicto. 

— Se  continúa  este  proceso  con  todas  las  reglas.  Al  final,  se  tendrá  que 
la  única  regla  del  conjunto  conflicto  es  la  regla  6,  ya  que  su  antecedente. 
H’,  pertenece  a la  Base  de  Hechos. 

La  etapa  de  resolución  del  conjunto  conflicto  es  nula,  ya  que  sólo  exis- 
te una  regla  en  el  conjunto  conflicto,  que  es  la  que  se  selecciona  para  ser 
aplicada  en  la  segunda  fase. 

En  la  fase  de  Acción  se  realizarán  las  siguientes  tareas: 

— Se  escoge  el  primer  elemento  del  consecuente  de  la  regla  L.  Como 
L no  pertenece  a la  Base  de  Hechos,  se  introduce  directamente. 

— A continuación  se  elige  el  segundo  elemento  del  consecuente,  A\ 
que.  en  este  caso,  es  el  último.  Al  no  pertenecer  tampoco  a la  Base  de  He- 
chos, se  introduce  también  en  la  Base. 

— Por  último,  debido  a que  H‘  era  una  hipótesis,  se  la  retira  de  la  Base 
de  Hechos. 

La  Base  de  Hechos,  después  del  primer  ciclo,  ha  quedado  como  sigue: 
BH  - <A.  L.  B.  C.  J> 

El  orden  en  el  que  aparecen  los  hechos  en  la  Base  de  Hechos  es  irre- 
levante  en  este  ejemplo.  Las  acciones  realizadas  en  este  primer  ciclo  se 
pueden  expresar  en  una  tabla,  como  la  1: 


Base  de  Hechos 

Regla  aplicada 

H BC  J 

6 

ALBCJ 

Tabla  I 
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Con  esto  se  cierra  el  pnmer  ciclo  de  funcionamiento: 

Segundo  ciclo: 

Dentro  de  la  etapa  de  equiparación,  se  observa  que  la  primera  regla  no 
m*  puede  introducir  en  el  conjunto  conflicto,  puesto  que  P'  no  pertenece  a 
la  Base  de  Hechos.  Sin  embargo,  la  segunda  regla  si  se  puede  introducir, 
puesto  que  A’  pertenece  a la  Base  y B también  pertenece. 

la  tercera  regla  también  se  puede  introducir  en  el  conjunto  conflicto, 
debido  a que  A*  pertenece  a la  Base.  A partir  de  la  tercera  regla  ninguna 
más  se  introducirá  en  el  conjunto.  Por  tanto,  el  conjunto  conflicto  estará 
li  M inado  por  las  reglas  2 y 3. 

En  la  etapa  de  resolución  del  conjunto  conflicto  ha  de  decidirse  qué  re- 
gla será  la  que  se  active.  En  este  caso,  la  estrategia  escoge  la  primera  regla 
«Id  conjunto  conflicto,  que  es  la  2. 

En  la  fase  de  acción  de  este  ciclo  se  introducen  D*  y G’  en  la  Base  de 
Hechos,  ya  que  no  pertenecían  a la  Base.  Al  mismo  tiempo  se  extrae  A‘  de 
la  Base,  pues  aparece  en  el  antecedente  de  la  regla  2 como  hipótesis.  Des- 
pués de  este  ciclo  la  tabla  quedará  como  aparece  en  la  tabla  2. 


Base  de  Hechos 

Conjunto  conflicto 

Regla  aplicada 

H’BCJ 

6 

6 

ALBCJ 

2 3 

2 

D’G’LBCJ 

Tabla  2 


Si  se  realiza  otro  ciclo  sobre  el  Sistema  de  Producción,  se  obtendrá  la 
labia  3. 


Base  de  Hechos 

Conjunto  conflicto 

Regla  aplicada 

H'BCJ 

6 

6 

ALBCJ 

2 3 

2 

D'G'LBCJ 

4 

4 

I G‘  L B C J 

Tabla  3 


En  este  punto  se  observa  que  no  se  puede  seguir  el  proceso.  No  hay  nin- 
guna regla  cuyo  antecedente  pertenezca  a la  Base  de  Hechos.  Con  lo  cual, 
en  la  fase  de  equiparación,  se  obtiene  un  conjunto  conflicto  nulo.  Esto  in- 
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dica  que  por  este  camino  no  se  va  a llegar  a una  solución.  Como  H no  per 
lenccc  a la  Base  de  Hechos,  tampoco  es  una  situación  final,  por  lo  que  no 
queda  más  remedio  que  echar  marcha  atrás.  Se  retrocede  hasta  la  ocasión 
más  cercana  en  la  que  se  dispusiera  de  un  conjunto  conflicto  de  más  de 
una  regla.  Este  es  el  caso  del  segundo  ciclo,  donde  el  conjunto  conflicto 
estaba  formado  por  las  reglas  2 y 3.  El  proceso  vuelve  a ese  punto,  por  lo 
que  la  Base  de  Hechos  debe  ser  la  que  se  tenía  antes  de  ejecutar  la  regla 
2.  A continuación  se  ejecuta  la  regla  3.  en  vez  de  la  regla  2.  y se  continúa 
el  proceso. 

Siguiendo  el  funcionamiento  del  Sistema  de  Producción,  se  obtiene  la 
tabla  adjunta: 


Base  de  Hechos 

Conjunto  conflicto 

Regla  aplicada 

H'BCJ 

6 

6 

A*  L B C J 

2 3 

3 

PLBCJ 

1 

1 

D’  E*  L B C J 

4 5 

4 

I E’  L B C J 

5 

5 

HD'ILBCJ 

4 

4 

H I LBC  J 

Tabla  4 


Se  ha  llegado  a la  solución,  puesto  que  H pertenece  a la  Base  de  He- 
chos  y todos  los  hechos  de  ésta  son  ciertos.  Sin  embargo,  ha  sido  necesa- 
ria la  utilización  del  "backtracking».  Supóngase  que  se  utiliza  otra  Estra- 
tegia de  Control. 

b)  Elección  de  la  regla  que  más  conocimiento  cierto  incorpore  a la 
Base  de  Hechos. 

En  este  caso,  la  Estrategia  de  Control  hubiera  elegido  la  regla  3 en  lu- 
gar de  la  2 en  el  segundo  ciclo.  Esto  se  debe  a que  la  regla  3 incorpora  un 
conocimiento  cierto,  C.  y la  2 no  incorpora  ninguno.  Al  final  del  proceso 
mediante  esta  Estrategia  de  Control,  se  obtendría  directamente  la  tabla  4. 
sin  necesidad  de  realizar  la  marcha  atrás. 

Existen  otras  formas  más  utilizadas  para  representar  la  ejecución  de  un 
Sistema  de  Producción.  Una  de  las  más  comunes  es  la  que  la  expresa  en 
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|ui  tita  de  árbol.  Asi.  el  funcionamiento  por  la  técnica  a)  vendría  expresado 


Los  arcos  entre  los  nodos  del  árbol  representan  la  regla  aplicada,  y los 
nodos  representan  el  estado  de  la  Base  después  de  aplicar  la  regla.  Como 
puede  observarse,  se  ha  representado  la  marcha  atrás  que  el  sistema  tuvo 
que  efectuar. 

6.  Funcionamiento  de  un  Sistema  de  Producción 
en  encadenamiento  hacia  atrás 

Los  Sistemas  de  Producción  que  funcionan  con  este  tipo  de  encadena- 
miento son  también  llamados  dirigidos  por  las  metas.  Esto  es  debido  a que 
en  lo  primero  que  se  fijan  es  en  las  metas  u objetivos.  En  general,  el  fun- 
cionamiento de  un  Sistema  de  Producción  de  este  tipo  es  el  siguiente: 

I ) Fase  de  Decisión 

a)  Etapa  de  Restricción.  Al  igual  que  en  los  anteriores,  se  puede  efec- 
tuar una  etapa  de  restricción  unto  de  la  Base  de  Hechos  como  de  las  Re- 
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glas,  Esto,  como  ya  se  ha  explicado,  facilita  la  labor  a las  siguientes  etapas, 
pues  limita  el  universo  que  ha  de  examinarse. 

bj  Etapa  de  Equiparación.  En  esta  etapa  se  buscan  y seleccionan  las 
reglas  en  cuyos  consecuentes  aparezca  el  primer  objetivo"  de  la  lista  de  ob- 
jetivos. Esta  lista  contendrá  al  principio  ¡as  metas  finales.  A medida  que 
funciona  el  sistema,  se  van  añadiendo  nuevas  metas  o eliminando  las  que 
tuviera,  según  los  criterios  que  se  expondrán  más  adelante. 

Al  buscar  en  los  consecuentes  antes  que  en  los  antecedentes,  introdu- 
ce una  diferencia  notable  con  respecto  al  encadenamiento  hacia  adelante. 
Se  comienza  por  las  metas  y se  retrocede  intentando  comprobar  los  ante- 
cedentes. Si  se  logra,  el  sistema  da  marcha  atrás  en  el  razonamiento:  si  ha 
sido  capaz  de  comprobar  los  antecedentes,  y como,  si  se  cumplen  los  an- 
tecedentes, se  cumplen  los  consecuentes,  se  sabe  que  el  sistema  puede  al- 
canzar las  metas  En  caso  contrario,  se  termina  el  proceso  con  fracaso, 

cj  Etapa  de  Resolución  del  conjunto  conflicto.  Al  igual  que  antes,  esta 
etapa  escoge  la  siguiente  regla  a -ejecuiar..  También  se  acude  al  método 
de  marcha  atrás  si  por  algún  camino  no  se  puede  seguir  el  proceso. 

Se  podría  construir  un  árbol  «Y-O»  que  reflejara  el  funcionamiento  del 
Sistema  de  Producción,  Los  nodos  «O*  representarían  las  diferentes  reglas 
que  se  pueden  aplicar  en  un  punto  determinado.  Por  su  pane,  los  nodos 
*Y»  representarían  los  objetivos  que  se  han  de  estudiar. 

2)  Fase  de  Acción 

La  ejecución  de  una  regla  consta  de  tres  pasos: 

“ S®  de  I a lista  de  objetivos  el  objetivo  que  esté  a la  cabeza, 

— Se  comprueba  si  los  hechos  del  antecedente  de  la  regla  pertenecen 
a la  Base  de  Hechos. 

— Se  introducen  en  la  lisia  de  objetivos  los  hechos,  dd  antecedente 
que  no  estuvieran  en  la  Base  de  Hechos,  Normalmente,  se  introducen  a[ 
principio  de  dicha  lista,  pero  en  ocasiones  puede  interesar  otra  tipo  de  or- 
denación de  la  lista, 

A continuación  se  empezaría  otro  ciclo  con  la  nueva  lista.  Cuando  la 
lista  de  objetivos  se  quede  vacia,  termina  el  proceso  con  éxito,  pues  han 
podido  deducirse  los  objetivos. 

I!  usp 

En  este  apartado  se  van  a describir  las  principales  característica»  de 
LI&P  Es  un  lenguaje  que  nació  en  los  años  60.  LISP  toma  su  nombre  de 
-List  programming*  (programación  con  lisias)  y está  fundamen  la  ¡mente 
orientado  a 3a  programación  simbólica.  Esta  es  una  de  las  características 
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que  han  hecho  que  LISP  sea  el  principal  lenguaje  de  programación  que  se 
utiliza  en  la  IA.  Otras  características  que  le  hacen  apropiado  para  IA  son: 

LISP  es  un  lenguaje  interactivo:  es  del  tipo  pregunta  respuesta,  con* 
viniéndose  la  programación  en  un  diálogo  entre  el  programador  y h 
máquina. 

— Con  el  paso  det  tiempo  se  han  ido  dcsarro liando  una  serie  de  entor- 
nos de  programación  que  lo  hacen  más  manejable  y potente. 

— No  hace  distinción  entre  programas  y datos,  por  lo  que  un  progra- 
ma LISP  puede  utilizar  otro  como  dalos. 

— Admite  rceursividad. 

Entre  los  defectos  que  le  achacan  sus  detractores  cabe  destacar  dos: 

— LISP  no  tiene  suficientemente  desarrollado  la  pane  dedicada  a ope- 
raciones aritméticas  y cálculos,  pero  esto,  en  realidad,  no  es  un  defecto,  ya 
que  en  tA  ei  número  de  operaciones  que  se  realizan  es  muchísimo  menor 
que  en  un  programa  de  gestión  o científico, 

— El  uso  de  paréntesis  puede  llegar  a confundir  al  programador.  Esto, 
en  principio,  puede  ser  un  inconveniente,  pero  no  es  difícil  de  dominar. 
Además,  obliga  a los  programadores  a concebir  claramente  sus  programas. 

La  unidad  básica  que  maneja  LT5P  es  el  átomo  Un  conjunto  de  átomos 
forman  una  unidad  superior  denominada  lista.  Las  lisias  también  pueden 
estar  formadas  por  grupos  de  listas.  Esta  es  una  característica  fundamen- 
tal de  LISP.  Los  átomos  y las  listas  se  llaman  expresiones  simbólicas 

Ejemplos  de  álomos  son; 

27 

3.1415 

TRES 

B27 

Los  dos  primeros  se  denominan  átomos  numéricos.  Los  tres  restantes 
son  símbolos. 

Utta  lista  está  compuesta  por  un  paréntesis  de  apertura,  a continuación 
una  serie  de  uno  o más  átomos  o listas  y,  por  último,  un  paréntesis  de 
cierro.  La  lisia  vacia  también  es  considerada  como  lista.  Por  ejemplo: 


( UNO  DOS  TRES  ) 

( UNO  l DOS  TRES  ) CUATRO  ) 

O 
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¡f  wgunda  lisia  consta  de  (res  elementos;  UNO  { DOS  TRES  ) y CHA- 
y n°  ,de  cujaIro  «Amentos,  « podría  pensar  en  un  principio. 

USP  consecra  como  elementos  de  la  lista  los  átomos  y las  listas  que  lo 
componen,  sin  entrar  en  la  estructura  de  dichas  listas 

Otro  concepto  impórtame  de  USP  es  d de  procedimiento  o función: 
es  a entidad  básica  para  decir  al  intérprete  lo  que  se  quiere  realizar.  Por 
ejemplo:  una  función  como  - multiplica  las  expresiones  que  encuentre  a 
continuación.  Us  funciones  que  se  encuentran  predefinidas  en  el  sistema, 
y que  forman  la  base  de  USP,  se  denominan  primitivas. 

Por  último,  un  conjunto  de  procedimientos  o funciones  forman  un  pro- 
grama, que  no  es  otra  cosa  que  una  función  que  utiliza  otras  fundones, 
Primitivas  tírirméticas 

LISP  tiene  implement&das  las  cuatro  reglas  básicas; 

— Suma: 

C + 2 3 ) 

S 

— Resta: 

(-74) 

3 

— Multiplicación: 

(*  5 3) 

15 

— División 

( / 7 2 ) 

3.S 

Además  de  csias  primitivas,  también  se  pueden  utilizar  otras  como: 

— MAX;  Halla  el  máximo  de  una  serie  de  números. 

— MJN:  Halla  el  mínimo  de  una  serie  de  números 
(MAX  2 4 5 9 }) 

9 

ÍMJN  2 4 5 9 1) 

ekVa  Um  ba5e  * U"  Tiene  la  siguiente  sintaxis: 

( base  > <exponen  le  > ) 

— SQRT:  Halla  la  raíz  cuadrada  de  un  número1 
1SQRT  ló) 

4.0 
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Si  tenemos  um  expresión  más  compleja  como: 

C+í/ó  3)  <-  5 2) 

Se  puede  deducir  fácilmente  el  resultado:  primero  se  divide  6/3,  oble- 
Hiendo  2 0,  y este  resultado  se  suma  al  obtenido  al  restar  5 - 2,  en  total, 
5.0.  Un  proceso  semejante  a éste  es  el  que  sigue  el  intérprete  de  LISP  al 
evaluar  una  expresión  como  ésta.  El  proceso  será  explicado  posterior- 
mente, 

Primitivas  para  el  manejo  de  listas 

Las  dos  principales  primitivas  para  trabajar  con  listas  son  CAR  y CDR, 

— CAR:  aplicado  a una  lista  devuelve  ti  primer  elemento  de  dicha  lis- 
ia como  resultado, 

- CDR:  aplicado  a una  lista  devuelve  otra  lista  que  contiene  la  origi- 
nal menos  el  primer  elemento: 

( CAR  'í  A B C )) 

A 

( CAR  l(  A B ) C)í 
(AB  ) 

( COR  (ABC)) 

(BC) 

( COR  (A  ( B C ) ) ) 

((BC)) 

La  comilla  que  antecede  a las  listas  tratadas  indica  al  intérprete  de  LISP 
que  la  expresión  que  viene  a continuación  no  debe  ser  evaluada. 

LISP  ¡amblé n permite  asignar  valores  a variables,  para  ello  se  utiliza  3a 
función  SETQ,  que  tiene  la  siguiente  sintaxis: 

(SETO  < variab  le  ><  valor  asignado  >) 

SETO  devuelve  el  valor  asignado  □ la  variable. 

( SETQ  ANIMALES  '(  PERRO  GATO  CABALLO  ) ) 

{ PERRO  GATO  CABALLO  ) 

Si  ahora  se  escribe  en  la  pantalla 

ANIMALES 

El  intérprete  devolverá  el  valor  asignada  a la  variable 
( PERRO  GATO  CABALLO  ) 

Esto  no  descarta  la  posibilidad  de  asignar  el  átomo  ANIMALES  a otra 
variable: 

( SETO  SER-VIVO  ANÍMALES  ) 

ANIMALES 

SER-VIVO 

ANIMALES 
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Si  se  aplica  Ja  función  CAR 

( CAR  ANIMALES  ) 

GATO 

( CAR  ANÍMALES  ) 

ERROR 

En  eE  primer  caso,  ANIMALES  no  lleva  cornil  la  y,  por  tamo,  el  intér- 
prete  Jo  toma  como  una  variable  y busca  su  valor/aplkándo  b función 
t AR  a dicho  valor.  En  d segundo  caso,  ai  tener  comilla  loma  ANIMALES 
como  una  constante  y aplicada  la  función  CAR  al  átomo  ANIMALES,  pro- 
duciendo un  mensaje  de  error,  ya  que  no  es  una  lista. 

Primitivas  para  la  construcción  de  listas 

Mientras  que  CAR  y CDR  descomponen  una  lista  en  sus  componentes 
simbóhc^  SÍBU1<?mCS  í>rimÍTivas  construyen  listas  a partir  de  expresiones 

APPEND:  une  los  elementos  de  las  listas  que  se  pasan  como 
argumentos; 

{APPEND  ( A B C ) '(  D E ) { F » 

(ABCDEF) 

Los  argumentos  deben  ser  lisias,  ya  que  si  no  ío  son  se  producirá  un 
error. 

(APPEND  '((  A 0 ) C ) *(  D ( E ) ) ) 

((AB)CD(E}) 

- LIST:  es  parecida  a APPEND,  ya  que  también  forma  listas,  pero  une 
Jas  I Estas  que  se  pasan  como  argumentos  y no  los  e tememos  que  compo 
nen  estas  listas. 

f LIST  UB)-(CD}) 

( ( A B ) ( C D ) > 

{ LIST  A B C ) '(  D E ) '(  F } ) 
((ABC)(DE)(F)) 

Es  decir,  cada  lista  que  se  pasa  como  argumento  es  un  demento  de  h 
isla  resultante,  mientras  que  en  el  caso  de  APPEND  cada  demento  de  Jas 
IfStas  que  se  pasan  como  argumentos  es  un  demento  de  la  lista  resultante. 

“ ToJ71a  una  lista  y añade  un  demento  aí  principio  de  la  lista: 

( CGNS  < nuevo  primer  ciernen  lo  J { lista  ) ) 

( CGNS  ’A  ‘{ABC)) 

(ABC) 

(CONS  r(A)((BC)) 

{ í A}BC) 
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A continuación  se  comparan  bs  tres  funcione»  nplk  «dn*  m fu*  mh-im.  . 
argumentos: 

( APPEND  '(  AHBCD)) 

( A BC D ) 

( LIST '{  A ) '{  B C D )) 

( ( A M B C Ü ) ) 

{ CONS  U)'(BCD)) 
í(A)BCD) 

También  existen  en  U3P  otras  funciones  auxiliares  para  manejar  listas 
que  se  enumeran  a continuación: 

— LENGTH;  devuelve  d número  de  elementos  que  contiene  una  lista: 

(LENGTH  '(ASCO)) 

4 

(LENGTH  ■(«  AB)(CDU) 

2 

(LENGTH  l(ABCD))) 

l 

— REVERSE:  coloca  en  orden  inverso  los  domen  los  de  una  lista: 

{ REVERSE  ‘{(AB)C(D(E)))) 

({(E)D)C(AB)) 

— SUBST:  sustituye,  en  una  lisia,  un  demento  por  otro  Sólo  la  pri- 
mera vez  que  lo  encuentra; 

( SUBST  { nueva  expresión  > ( expresión  a reemplazar  i ( lista  ) J 
( SUBST  A B '{  A B C )) 

( A A C ) 

Si  no  encuentra  el  átomo  indicado,  no  realiza  ninguna  operación; 
( SUBST  A B '(  A { B ) G ) ) 

(ABC) 

LAST:  devuelve  una  lista  formada  por  el  úl tinto  componente  de  la 

lista  pasada  como  argumento: 

( 1AST  ( A B C D ) ) 

U>) 

Es  equivalente  a aplicar  REVERSE  V CAR  a la  lista  original: 

( LAST  ’(  A B C D ) ) ■ ( CDR  { REVERSE  ( A B C D ) ) ) 
Por  supuesto,  todas  las  primitivas  vistas  hasta  ahora  aceptan  como  ar- 
gumentos oirás  funciones  o variables: 

( CAR  { CDR  '(  A ( B C ) D ) ) ) 

(BC) 
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oaummoso  11™  DOS  TRES  CUATR0  C[NC0  SE1S  SIETE 

CERO^j  UN°  ^ TRES  CUATRO  CINCO  SEIS  SJETE  OCHO  NUEVE 

( SETO  VOCALES  '(AElOUj) 
í AEI  OU  ) 

{ APPEND  ( CDR  DIGITOS  ) VOCALES  ) 

1 O O f D°S  TR£S  CUATRO  ClNCO  SEIS  S^TE  OCHO  NUEVE  DIEZ  A E 

< APPEND  ( LIST  ( CAR  DIGITOS  ) ) { LAST  DIGITOS  ) I 
(UNO  CERO  ) 

Para  consepiir  evaluar  «tas  expresiones,  ef  intérprete  de  USP  sigue 
los  pasos  detallados  en  la  figura: 


LISP  también  permite  la  definición  de  nuevas  funciones  que  no  se  di’ 
ferenciarán  en  nada  de  las  primitivas,  a 3a  hora  de  operar  con  ellas  Para 


46 


ello  se  dispone  de  la  primitiva  DEFUN.  Consiste  en  combinar,  üvgün  se  ne- 
cesite, las  Funciones  ya  existentes.  El  Formato  de  DEFUN  es  el  siguiente: 

( DEFUN  ( nombre-función  ) (parámetro,  parámetro,  ...  parámetro  J 
( acción,  ) 

(acción,  ) 

(acción.)  ) 

DEFUN  no  evalúa  sus  argumentos,  sólo  sirve  para  que  el  intérprete  al’ 
macctie  la  definición  de  la  función  con  vistas  a su  posterior  utilización.  DE’ 
FUN  devuelve  el  nombre  de  la  fundón  como  resultado  A partir  de  ese  mo- 
mento se  puede  utilizar  la  nueva  función  como  si  de  una  primitiva  se 
tratase. 

Por  ejemplo,  una  función  que  convierta  kilómetros  por  hora  a metros 
por  segundo. 


toe,UNCW-e®í,.A}f.V» 


Ahora  se  puede  utilizar  como  una  primitiva  normal 
( CONVERSION  50  ) 

13.8859 

Las  variables  que  se  declaran  como  argumentos  en  la  función  sólo  exis- 
ten mientras  se  esté  ejecutando  la  función.  Es  decir,  al  evaluar  LISP  la  ex- 
presión (CONVERSION  50)  asigna  50  a la  variable  VALOR  y realiza  las  ope- 
raciones indicadas  en  el  cuerpo  de  la  función,  pero  una  vez  terminadas  eS’ 
las  operaciones,  la  variable  desaparece.  Si  intentamos  buscar  su  valor: 

VALOR 

ERROR 

el  intérprete  responderá  con  un  error,  ya  que  no  es  una  variable  que 
esté  definida  fuera  de  la  Función.  El  siguiente  ejemplo  muestra  una  finí’ 
ción  con  dos  paráme  tros: 


t DEFUN  FUERZA  f MASA  ACELERACION  J 
( * MASA  ACELERACION  ) ) 


( FUERZA  5 A ) 
30 
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Predicados 

Un  predicado  en  LISP  es  una  función  que  devuelve  verdadero  o falso 
como  resultado.  El  equivalente  a verdadero  en  LISP  es  T (de  TRUE,  en  es- 
pañol, cierto)  y el  de  falso  es  NIL  (en  español  nada).  A efectos  de  compu- 
tación. LISP  considera  verdadero  cualquier  cosa  distinta  de  NIL.  Los  pre- 
dicados principales  son: 

- ATOM;  comprueba  si  el  argumento  es  o no  un  átomo: 

( ATOM  UNO  ) 

T 

( ATOM  VOCALES  ) 

NIL 

( ATOM  VOCALES) 

T 


— LISTP:  comprueba  si  el  argumento  es  una  lista: 

( LISTP  VOCALES  ) 

T 

(LISTP  *(  A B C D ) ) 

T 

(LISTP  A ) 

NIL 

— EQUAL:  comprueba  la  igualdad  de  los  argumentos. 

( EQUAL  B B ) 

T 

(EQUAL  VOCALES* VOCALES  ) 

NIL 

( EQUAL  VOCALES  ( A E I O U )•) 

T 


Cuando  se  utilizan  expresiones  aritméticas  se  usa  el  predicado  •-*.  que 
comprueba  si  dos  números  son  iguales. 

— NULL:  devuelve  T si  el  argumento  es  una  lista  vacia  y NIL  en  caso 
contrario: 


(NULL  0 ) 

T 

( NULL  DIGITOS  ) 
NIL 


— MEMBER:  se  utiliza  para  saber  si  un  átomo  forma  parte  de  una  lis- 
ta. Tiene  la  siguiente  sintaxis: 

( MEMBER  (átomo)  (lista)) 

( MEMBER  DOS  VOCALES  ) 

NIL 
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En  el  caso  de  que  se  cumpla  el  predicado,  devuelve  el  resto  de  la  lista 
a partir  del  elemento. 

( MEMBER  DOS  DIGITOS  ) 

( DOS  TRES  CUATRO  CINCO  SEIS  SIETE  OCHO  NUEVE  CERO  ) 
NUMBERP:  compruebe  si  el  argumento  es,  o no,  un  número: 
( NUMBERP  10  ) 

T 

( NUMBERP  DIEZ  ) 

NIL 

Por  último,  existen  otra  serie  de  predicados  propios  de  los  números 
romo  son:  T (menor  que),  ')*  (mayor  que),  que  comprueban  si  la  suce- 
sión formada  por  los  argumentos  es  creciente  o decreciente. 

(<2468) 

T 

((22468) 

NIL 

ZEROP,  EVENP  y MINUSP  comprueban  si  el  argumento  es  cero,  par  o 
negativo,  respectivamente. 

Operadores  lógicos 

A veces  es  necesario  combinar  varios  de  estos  predicados  para  formar 
la  condición  que  se  quiere  utilizar,  esto  se  puede  realizar  con  los  opera- 
dores lógicos. 


— NOT:  niega  el  argumento 

(NOT  T ) 

NIL 

( NOT  ( NUMBERP  DIEZ  ) ) 

T 

— AND:  sólo  es  cierto  si  todos  los  argumentos  lo  son.  En  cualquier 
otro  caso,  el  resultado  es  NIL. 

— OR:  es  cierto  en  cuanto  uno  de  los  argumentos  lo  sea.  En  cualquier 
otro  caso,  el  resultado  es  NIL. 

Estos  operadores  devuelven  el  último  argumento  computado  como 
cierto. 

( AND  ( MEMBER  DOS  DIGITOS  ) ( MEMBER  CERO  DIGITOS  ) ) 
( CERO  ) 

(OR  ( MEMBER  DOS  DIGITOS  ) ( MEMBER  SIETE  DIGITOS  ) ) 
( SIETE  OCHO  NUEVE  CERO  ) 

( OR  ( NOT  ( NUMBERP  DIEZ  ) ) ( LISTP  VOCALES  ) ( MEMBER 
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ROJO  DIGITOS  ) ) 

T 

COND:  es  un  predicado  que  se  utiliza  para  seleccionar  una  alterna- 
tiva de  entre  varias  posibles;  su  forma  general  es: 

(COND  ((TEST,)  (ACCION,)) 

( (TEST,)  (ACCION,)  ) 

( (TEST*)  (ACCION*»  ) 

Cada  lista  es  una  opción,  el  mecanismo  que  se  sigue  para  ejecutar  este 
predicado  es  el  siguiente:  se  va  comprobando  cada  test  hasta  que  se  cum- 
ple uno,  entonces  se  ejecuta  la  acción  correspondiente  a dicho  test  y se  ter- 
mina la  función.  COND  devuelve  como  resultado  el  que  devuelva  la  úl- 
tima función  evaluada  dentro  del  predicado;  en  caso  de  que  ningún  test  se 
cumpla,  el  predicado  devuelve  NIL  y no  ejecuta  ninguna  acción. 


( DEPUN  NUM-DIAS  ( MES) 

1 cond  ;;  "g^zss&str0  mayo  juuo  aoosto 

?(  EQUAL  MES  'FEBRERO  ) 

((ME 


w 


EMBER  MES  '(  ABRIL  JUNIO  SEPTIEMBRE  NOVIEMBRE  )) 


( NUM-DIAS' MARZO  ) 

31 

( NUM-DIASCUATRO  ) 

NIL 

ya  que  no  se  cumple  ninguna  condición  y,  en  consecuencia,  no  se  realiza 
ninguna  acción. 

Si  se  quiere  que  dé  un  mensaje  de  error  en  caso  de  que  no  se  cumpla 
ninguna  condición,  o que  se  realice  alguna  acción  por  defecto,  se  puede 
utilizar  el  valor  T: 


( DEPUN  NUM-DIAS  ( MES) 

! comd  ¡¡  mayo  jüuo  acosto 
< < EQUAL  MES  ’PEBRKRO  ) 

U MEMBER  MES  ?(  ABRIL  JUNIO  SEPTIEMBRE  NOVIEMBRE  )) 
( T •<  BL  VALOR  ASIQNADO  NO  ES  UN  MES  ) ) ) ) 
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Ahora  la  respuesta  a ( NUM  DIASCUATRO  ) será: 

EL  VALOR  ASIGNADO  NO  ES  UN  MES 

Todas  las  funciones  que  se  han  explicado  hasta  el  momento,  salvo  las 
que  se  dice  explícitamente,  pueden  aceptar  un  número  variable  de  argu- 
mentos. Los  operadores  AND  y OR  también  aceptan  un  número  variable 
de  predicados. 

Las  funciones  CAR  y CDR  se  pueden  combinar  de  la  siguiente  manera: 
CADR ...-(  CAR  ( CDR  ...)  ) CDDAR  ...  - ( CDR  ( CDR  ( CAR  ...))) 
hasta  4 niveles  de  paréntesis. 

Variables  libres  y ligadas 

Cuando  se  utiliza  una  función,  se  hace  una  serie  de  asignaciones  a los 
argumentos  que  tiene  dicha  función.  Esta  asignación  recibe  el  nombre  de 
• asignación  lambda».  Por  ejemplo: 

( SETO  VAL  125  ) 

125 

( SETO  AUX  18  ) 

18 

( SETO  CIEN  100  ) 

100 


( DEPUN 

il¡S§) 


( DEPUN  DUPLICAR  ( VAL  ) 

T VALÍ  • 3 VAL) 

) AUX VALOR)  ) 


si  se  llama  a la  función  duplicar  con  el  argumento  cien 
( DUPLICAR  CIEN  ) 

200 

ahora  las  variables  tienen  los  siguientes  valores: 

AUX 

200 

CIEN 

100 

VALOR 

125 

El  valor  de  CIEN  nunca  cambia,  ya  que  no  se  hace  ninguna  nueva  asig- 
nación a CIEN.  El  valor  de  AUX  siempre  va  a cambiar,  ya  que  se  hace  una 
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asignación  dentro  de  la  función.  El  valor  contenido  en  VAL  si  que  va  a cam- 
biar durante  el  proceso,  ya  que  al  entrar  en  la  función  se  le  asigna  100,  lue- 
go en  virtud  de  las  operaciones  pasa  a ser  200  y al  salir  de  la  función  se 
restaura  el  valor  primitivo,  ya  que  VAL  está  definida  en  la  lista  de 
parámetro. 

El  proceso  que  se  sigue  es  el  siguiente:  al  hacer  la  llamada  a una  fun- 
ción, LISP  crea  espacio  para  almacenar  los  valores  asignados  a los  argu- 
mentos de  la  función.  Cada  vez  que  aparezca  una  referencia  a las  variables 
que  están  contenidas  en  la  lista  de  argumentos,  se  utiliza  el  valor  almace- 
nado en  dichos  espacios  de  memoria,  sin  alterar  el  contenido  de  alguna  va- 
riable que  tuviese  el  mismo  nombre,  pero  que  estuviese  definida  a un  ni- 
vel superior.  Cuando  se  termina  de  ejecutar  la  función,  la  zona  de  me- 
moria queda  libre.  De  este  proceso  surge  el  concepto  de  variable  libre  y 
ligada. 


— Variable  libre,  con  respecto  a una  función,  es  un  simbolo  que  no 
aparece  en  la  lista  de  argumentos  de  la  función. 

Variable  ligada,  con  respecto  a una  función,  es  la  que  aparece  en 
dicha  lista. 

Recursión 


Lo  siguiente  es  un  ejemplo  de  cómo  se  trata  la  recursión  en  LISP. 


( DEPUN  FACTORIAL  ( N ) 

( COND  ( ( EQUAL  N 0 ) 1 ) 

( T ( • N (PACTOR1AL  ( - N 1 ) ) ) ) ) ) 


(FACTORIAL  6) 

24 

Al  efectuar  esta  operación,  USP  sigue  los  siguiente  pasos. 
Otro  ejemplo: 


<DEP"  CO^"(°NOT  (¡ffoil  LISTA  ) ) 


( N-ESIMO  3 *(  UNO  DOS  TRES  CUATRO  CINCO  SEIS  ) ) 
( TRES  CUATRO  CINCO  SEIS  ) 


La  recursión  es  una  de  las  ideas  que  más  potencia  da  a LISP  y una  de 
las  razones  por  las  que  se  utiliza  LISP  en  IA  (muchos  problemas  se  resuel- 
ven con  recursión).  Se  dice  que  un  objeto  es  recursivo  cuando  forma  par- 
te de  si  mismo  o se  define  en  función  de  si  mismo.  Un  ejemplo  es  la  ima- 
gen de  televisión  que  se  contiene  a si  misma.  También  es  un  concepto  que 
aparece  con  frecuencia  en  matemáticas,  por  ejemplo,  en  la  definición  de 
funciones: 

El  factorial  de  un  número  es  ese  número  multiplicado  por  el  factorial 
de  su  antecesor. 


Los  pasos  que  sigue  son  los  siguientes: 

Se  puede  demostrar  que  cualquier  operación  recursiva  puede  ser  rea- 
lizada de  forma  iterativa. 

Iteración 

USP  posee  una  sene  de  primitivas  que  permite  realizar  iteraciones: 

— MAPCAR:  se  utiliza  cuando  una  misma  función  va  a ser  utilizada  so- 
bre toda  una  lista  de  elementos.  Su  sintaxis  es  la  siguiente: 

( MAPCAR  (función)  (lista)  ) 


FAC  ( N ) - N • FAC  ( N - I ) 

FAC  ( 0 ) - I 

La  potencia  de  la  recursividad  reside  en  poder  definir  un  número  infi- 
nito de  objetos  mediante  un  enunciado  finito  o,  lo  que  es  lo  mismo,  un  nú- 
mero infinito  de  operaciones  en  una  operación  finita.  A pesar  de  su  poten- 
cia, la  recursión  es  un  arma  de  doble  filo  y en  determinadas  ocasiones  pue- 
de suponer  un  mayor  gasto  de  tiempo  que  una  solución  no  recursiva  del 
problema,  ya  que  hay  problemas  en  los  que  la  recursión  hace  repetir  cálcu- 
los inútilmente,  aumentando  el  tiempo  de  computación. 


como  resultado  devuelve  una  lista  compuesta  por  los  resultados  de  apli- 
car la  función  a cada  elemento  de  la  lista. 

( MAPCAR  ATOM‘(  (A)BC(DE)F)) 

( NILTTN1LT) 

Si  la  función  a la  que  se  aplica  MACPAR  necesita  más  de  un  argumen- 
to, se  debe  especificar  una  lista  para  cada  argumento. 

( MAPCAR  EQUAL  ( 2 3 7 ) ( 2 5 6 ) ) 

( T NIL  NIL  ) 
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APPLY:  se  utiliza  para  aplicar  una  función  a una  serie  de  argumentos. 
Considérese  el  siguiente  caso: 

( SETO  NUM*(  2 4 8 )) 

( 2 4 8 ) 

Si  ahora  se  intenta  hacer 

( ♦ NUM  ) 

el  interprete  va  a responder  con  un  mensaje  de  error,  ya  que  al  evaluar  la 
función  ‘+\  espera  encontrar  argumentos  numéricos,  y lo  que  encuentra 
es  una  lista.  Para  salvar  este  inconveniente  se  utiliza  la  función  APPLY, 
que  tiene  el  siguiente  formato: 

( APPLY  (función)  (lista  de  argumentos)  ) 

Si  ahora  se  aplica  dicha  función 

( APPLY  '♦  NUM  ) 

14 

Esta  función  se  puede  utilizar  para  operar  con  el  resultado  de  la  fun- 
ción MAPCAR.  por  ejemplo:  se  quiere  calcular  el  número  total  de  átomos 
que  componen  una  expresión: 


( DEPUN  CONT-ATOM  < LISTA  ) 

( CONO  ( ( NULL  LISTA  ) 0 ) 

( ( ATOM  LISTA  ) 1 ) 
(T<  APPLY  '♦<  MAPC, 


AR  'CONT-ATOM  LISTA  ) ) ) ) ) 


— DO:  es  una  primitiva  más  potente  para  la  realización  de  iteracio- 
nes. La  sintaxis  de  DO  es  un  poco  más  larga,  pero  fácil  de  entender  siguien- 
do un  ejemplo: 

ak  - a a a a a ...  a 


(DEFUN  POTENCIA  ( BASE  EXP  ) 
( DO  ( ( CONT  1 ) 

( B EXP  ) ) 

OP 


( ZEROP  B ) RESULTADO  ) 

SETQ  RESULTADO  (•  RESULTADO  BASE  ) ) 
SETQB(-Bl)))  ) 


Analizando  la  función,  lo  primero  que  se  encuentra  es  una  lista: 
((CONT  1)  (B  EXP))  con  dos  expresiones,  cada  una  contiene  un  paráme- 
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kude  y su  vaí°r  A continuación  se  encuentra  oirá  lisia  corn- 
il SÍL2  Át  lenT,ínBCÍdn  deí  buclc:  < » > Y ta  acción 

RESULTADO,  Por  último,  se  encuentra  una  serie  de  acciones  que  se  eie- 
cutan  en  cada  iteración  del  bude.  También  se  puede  añadir  a HiL  d e 

^re‘™S-  Una  CJtPr“'0"  que  indica  la  Forma  de  actualizar  cada  parame- 
tro.  La  sintaxis  completa  es  la  siguiente:  p ' 

( DO(  ((parámetro,)  (metalización,)  { actual izaciónj  ) 

(íparametroj)  (ínicializatión*)  {actualización})  ) 

( {parámetro J (inicwJizacjónJ  {actualización,,) 

íiSn  dC  Sal,da>  ÍCXpr€SÍÜnes  iI1Icrmetl^>  {expresión  de  sa- 

{Sentencias  ejecutables  en  cada  iteración)) 

Tí*1**  ^ Ricial  ilaciones  se  realizan  antes  de  realizar  cualquier  asig- 

“ i l daS  toS**,ttBctone*  sc  hace»  «te*  de  la*  reasignaciones  De 
«lo  se  deriva  que  DO  maneje  sus  parámetros  en  paralelo,  es  decir  que  si 
un  parámetro  influye  en  otro  a la  hora  de  actualizar  su  valor  el  valor  eme 

b“  dW“  op“«di»  - " *-  •«*  - la 

Existe  una  variante  de  esta  función  que  permite  hacer  b asignación  v 

“roTúrí!™  í“ T V'ama  D0*  An,es  Jc  introducir  I.  pnmi.í- 
PrimUtva  PHOT  a!  , wa'™r  operaciones  itcraÜTus  cra  medUnte  b 
pnmutva  PROG.  Al  igual  que  DO.  su  sintaxis  es  bástame  sencilla 


í DÉFUR  EXPONENCIAL  £ M N ) 

™ " ~ SS&ESwmtmián tí : 


{ PROG 

«J* 


ÍSSS 


m. 


iTADO ) } 


‘ Sff7oo  LOOP íft* ' ' 1 ) > 


,¡„^]PrimeI0  qUE  apfreVc  a c°niinuacíón  da  PROG  es  una  lista  que  con- 
1 su  vi?*  Pa  m''rOS  dcl  l¡ud'-  «tM  variables  son  ligadas  v se  reasignan 
air  «/NÍlT1P'1^  d"  PRO°  Si  ™ esi.ren  parame.™,  debe 

loTmrtmet™  di^h  5U|  UgBr‘  comtauaeió"-  garete  la  i nic .aligación  de 
rell™  Jd  bUCj*’  y U"a  e,itSue,a  <(•«  delimita  las  funciones  que  se 
realiaan  en  cada  Me  ración  del  bucle.  De  ellas  una  tiene  que  aparecer  ne 
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icariamente  para  que  termine  la  ejecución  de  PROG:  RETURN;  en  el  mo- 
nwnio  que  el  intérprete  encuentra  dicha  instrucción  parará  O la  ejecución 
drl  bucle  y devolverá  como  resultado  el  que  indique  la  Función.  Para  In- 
dicar la  vuelta!  al  principio  del  bucle,  se  utiliza  la  función  (GO  {etiqueta)) 
lii  función  PRQG  admite  anidam  lento. 

PRDG1  y PRíXiN  son  dos  variantes  de  csia  primitiva:  se  utilizan  para 
realizar  secuencias  de  funciones  devolviendo  el  valor  de  una  de  ellas, 

( PROG  t(  + 2 3 M SETO  X ‘Z>  ( SETO  Y X ) ) 
ó 

< PROGN  ( + 23  ) { SETO  X Z ) ( SETO  V X ) ) 

X 

Liste  de  propiedades 

Otro  concepto  que  utiliza  L1SP  es  el  de  listas  asociativas;  consiste  en 
una  lisia  de  listas,  en  las  que  el  primer  demento  es  una  clave  de  acceso  a 
dicha  sublista, 

( SETO  COCHE  A ( ( COLOR  VERDE  ) 

( MARCA  SEAT  ) 

(TIPO  127  ))  ) 

( { COLOR  VERDE  ) ( MARCA  SEAT  ) (TIPO  127  ))  > 

Para  extraer  el  comen  ido  de  esta  estructura  se  utiliza  la  primitiva 
ASSOC: 

( ASSOC  COLOR  COCHE- A ) 

{ COLOR  VERDE  ) 

( ASSOC  MARCA  COCHE- A ) 

£ MARCA  SEAT  ) 

Hay  que  poner  de  manifiesto  que  la  lista  puede  contener  dos  sablista* 
con  la  misma  clave  de  acceso,  ASSOC  sólo  devuelve  el  contenido  de  la  pri- 

Imera  lista  que  encuentre. 

También  se  puede  utilizar  la  primitiva  GET  para  manejar  las  lisias  de 
propiedades,  aunque  esta  primitiva  es  mucho  más  general, 

( CET  COCHE-A  COLOR  ) 

VERDE 

«Si  h propiedad  no  existe,  devuelve  NIL- 

Las  propiedades  se  pueden  eliminar  de  las  lisias  de  propiedades  me- 
diante la  primitiva  REMPROP,  que  tiene  la  siguiente  sintaxis: 

( REMPROP  (nombre  del  símbolo)  (nombre  de  la  propiedad)  ) 
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Se  puede  utilizar  la  primitiva  SETF  para  asignar  o reasignar  un  valor  a 
una  propiedad. 

( SETF  ( GET  'COCHE  A' COLOR  ) ROJO  i 
ROJO 

( GET  ‘COCHE- A' COLOR ) 

ROJO 

La  primera  opresión  de  SETF  identifica  el  símbolo  y la  propiedad  que 
se  va  a resignar.  A continuación  aparece  el  nuevo  valor. 

Definición  de  estructuras 

Se  pueden  utilizar  diversas  estructuras  como  listas,  listas  de  propiedad 
des,  estructuras  creadas  por  cada  programador,  etc.,  dependiendo  de  cada 
circunstancia,  pero  es  conveniente  definir  una  estructura  en  el  computa- 
dor y utilizar  muchas  variables  con  esa  misma  estructura,  sin  necesidad 
de  construirla  cada  vez.  USP  proporciona  una  primitiva  para  definir  es- 
truc  tu  ras  similares  a los  registros;  DEFSTRUCT.  Se  puede  acceder  indivi- 
dualmente a cada  una  de  las  partes  de  dichas  definiciones. 

( DEFSTRUCT  ( PERSONA  } 

< SEXO  NJL  ) 

(ALTURA  L70) 

( PESO  65  ) 

(PROF  NJL  > ) 

En  primer  lugar,  se  encuentra  el  nombre  de  la  estructura  entre  parén- 
tesis y;  a continuación,  una  serie  de  lisias  compuestas  por  un  par  (campo, 
valor  por  defecto).  La  primitiva,  ademas  de  definir  la  estructura,  crea  la 
¡unción  necesaria  para  asignar  dicha  estructura  a una  variable  y para  ac- 
hij  eFu  01  c*^t'nt°5  camP°S-  En  este  caso,  crea  la  función  MAKE-PERSO- 
NA.  Ahora  se  puede  hacer  una  asignación  de  la  siguiente  forma; 

C SETO  JUAN  ( MAKE  PERSONA  ) } 

APERSONA  71Có;l2EA> 

Si  se  quiere  acceder  al  contenido  de  lus  distintos  campos,  se  utilizarán 
las  otras  Funciones  que  también  crea  DEF5TRUC: 

( PERSONA-SEXO  JUAN  } 

NIL 

( PERSONA-PROF  JUAN  ) 

NJL 

Si  lo  que  se  desea  es  modificar  los  valores  de  estos  campos  se  utilizara 
la  función  SETF: 

( SETF  ( PERSONA-PROF  JUAN  ) MEDICO  ) 

MEDICO 
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(PERSONA-PROF  JUAN  > 

MEDICO 

También  cabe  la  posibilidad  de  asignar  valores  distintos  al  crear  una  va- 
riable con  la  esiruciura  definida: 

t SETO  PEDRO  (MAKE-PERSONA  :PROF  MILITAR  ¡SEXO  V ¡ESTA  - 
TURA 'l M : PESO  ‘75  ) ) 

#(  PERSONA  79SC6: 1 9ÓEA> 

La  utilización  de  esta  primitiva  es  más  apropiada  que  crear  estructuras 
en  base  a combinaciones  de  lista s y además  ahorra  trabajo,  ya  que  no  hay 
que  hacer  las  funciones  necesarias  para  acceder  a los  campos  de  la 
estructura. 

Intradd/saUJa 

Hasta  et  momento,  la  única  manera  de  que  el  ordenador  tome  infor- 
mación es  a partir  de  los  argumentos  de  la  función,  y las  únicas  salidas 
son  las  proporcionadas  por  las  función  es.  A continuación  se  explica  las  pri- 
mitivas básicas  de  E/S: 

— PIUNT  evalúa  su  argumento  y lo  imprime  en  una  línea  aparte: 


( DEFUN  PARES  < tt  } 


( PARES  A ) 

2 

4 
6 

5 


A veces  es  necesario  imprimir  caracteres  especiales  que,  como  norma 
general,  no  están  permitidos.  Para  salvar  este  inconveniente  se  pueden  uti- 
lizar barras  verticales  o *\*r 

( PRINT  ICI ) 

W 

( PRINT  V ) 

( PRINT  1UN  BLANCd  ) 

[UN  BLANCOl 


— READ:  cuando  el  intérprete  encuentra  esta  primitiva,  se  para  y es- 
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pcm  a que  el  usuario  int reduzca  un  dato  por  tJ  teclado.  El  valor  que  de- 
vuelve, es  leído:  4 

{ READ  ) UNO 
UNO 

í SETO  EJ  EMPLO  ( READ  ) > DOS 
DOS 

Va  que  READ  nos  índica  que  se  está  esperando  un  dato,  es  convenien- 
te poner  Ja  función  PRINT  indicando  que  se  quiere  leer  un  dato. 

de  b linef™  Pft>dllCe  Un  saltü  de  hnca  V coloca  el  cursor  al  principio 

7 P?^N,:  CS  ]Rual  qu,e  pR1NT-  con  la  diferencia  de  que  no  empieza  la 
impresión  en  una  nueva  linea  ni  finaJiza  con  un  blanco. 

( PRINT  X ) - ( PROGN  ( TERPR]  ) ( PRINi  x ) ( PRJNI  1 í ) > 

símbolof1NC  lgU¿]  qUe  PRINÍ'  *alvo  suprime  las  barras  de  los 

í PRINC  1(1) 


Matrices 

LISP  también  pertmtc  la  definición  de  matrices  de  una  o dos  dimen- 
siones. Para  crear  una  matriz  se  utiliza  la  primitiva  MAKE  ARRAY: 

( SETQ  MATRIZ  { MAKE  ARRAY  b(3ü  30  i ) 

#í  ARRAY  79SCfi:|9fiEA  ) 

Esta  semencia  crea  una  mainz  de  nombre  MATRIZ  de  dos  dimensio 

3S  CTSrd,CeS  varia"  cmre0-v  29  Por  definición,  los  subíndices  om- 
pie/an  desde  cero. 

tivaPAREFbt<?ner  Cl  U"  dcterminado  elemento  se  utiliza  b primi- 

( AREF  MATRJZ  S 7 ) 

Si  lo  que  se  quiere  es  variar  el  contenido  de  uno  de  los  elementos  se 
ut  1 1 izará  la  pri  m it  iva  SETPr  ’ 

( SETF  { AREF  MATRIZ  5 7 ) 80  ) 

80 

uJ^^s1oT°  de  unos  de  de  k - -- 

( Att RA Y-D | M ENS1 0 N MATRIZ  0 } 

30 

La  numeración  de  los  subíndices  también  empieza  en  cero. 


JUEGOS  CONTRA  LA  NATURALEZA  ~) 
0 DE  UN  SOLO  JUGADOR  L 


EL  DISCO  TONTO 


EL  disco  tanto  consiste  en  cuatro  círculos  concéntricos, 
cada  uno  de  los  cuales  puede  girar  alrededor  de  JU  cen- 
tro.  A su  vez,  cada  círculo  está  dividido  en  ocho  sectores 
iguales  con  un  número  escrito  en  cada  uno.  La  figura  5 
muestra  la  disposición  del  disco. 

El  objetivo  dd  juego  es  girar  los  circuios  del  disco  de 
forma  que  los  números  de  cada  radia  o sector  invisible  su- 
— — men  doce. 

Este  disco  es  un  claro  ejemplo  de  los  juegos  > problemas  en  los  que  el 
número  de  posibles  combinaciones  es  relativamente  grande  Es  lo  que  se 
denomina  explosión  combinatoria.  A este  tipo  de  juegos  también  pertene- 
ce el  ajedrez.  Sin  embargó,  si  se  tienen  en  cuenta  determinadas  propieda- 
des, el  disco  puede  ser  solucionado  en  unos  pocos  intentos. 

Como  puede  observáis®  en  la  figura  5,  si  cada  radio  debe  sumar  12,  en- 
tonces cada  diámetro  debe  sumar  24  y,  por  tanto,  la  cruz  48.  Con  lo  cual, 
se  puede  establecer  primero  como  meta  el  hacer  que  la  cruz  sume  48.  Para 
lograr  esto  hay  24  posibles  combinaciones  diferentes.  Los  giros  de  los  circu- 
ios de  90,°  v 180,"  no  cambian  la  suma  de  los  números  de  la  cruz,  pues 
b siguen  componiendo  los  mismos  números.  Sin  embargo,  giros  de  +45 
o de  -45’  cambian  la  configuración  de  la  cruz.  En  cuanto  se  obtenga  la  sub- 
írtela de  que  los  números  de  la  cruz  sumen  48,  se  habrá  reducido  enorme- 
mente el  problema. 

La  segunda  sübmeta  que  ha  de  conseguirse  es  que  los  números  de  lo- 
dos los  diámetros  sumen  24,  Si  se  practicaran  giros  de  +45“  o -45*  se  que 
daría  rota  la  suma  de  la  cruz.  Por  tanto,  han  de  realizarse  giros  de  90’.  Los 
giros  de  180’  no  cambian  la  configuración,  pues  los  diámetros  siguen  to- 
mando los  mismos  números.  El  número  de  posibilidades  es  24. 

Por  último,  se  ha  de  establecer  la  meta  inicial,  es  decir,  conseguir  que 
los  radios  sumen  12.  Sólo  nos  sirven  giros  de  ISO’,  pues  otro  tipo  de  giro 
estropearía  la  configuración  formada. 
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Fig  S. 


De  esta  manera,  el  número  de  ensayos  necesarios  para  llegar  a la  solu 
i n f 7r  ™ numero  es  muy  inferior  a las  8«  posibles  combinaciones. 
U solución  a osle  problema,  típico  de  la  búsqueda  heurística,  se  basa  en 
tíos  principales  características: 

— Cada  posición  ganadora  ¡iene  una  propiedad  (cada  radiu  suma  12), 
Esto  es  generaii  ¡fiable  para  casi  todos  Eos  juegos  y problemas  de  este  libro 
No  solo  eso,  sino  que  además  esta  propiedad  envuelve  o implica  otras  pro- 
piedades  como,  por  ejemplo,  la  de  que  la  suma  de  cada  diámetro  debe  ser 
24,  y la  suma  de  la  cruz  48,  Sin  embargo,  estas  propiedades  no  implican 
una  posición  ganadora,  a no  ser  que  se  tomen  en  conjunto. 

— Existen  determinados  movimientos  que  no  cambian  el  estado  dd 
problema.  Hay  que  tenerlos  en  cuenta  a la  hora  de  obtener  la  solución  de* 
bido  a que  se  pierde  tiempo  e intentos  al  realizarlos.  Al  mismo  tiempo  sc 
ha  de  tener  presente  que  determinados  movimientos  pueden  destrozar  h 
situación  alcanzada.  Este  es  d coso,  por  ejemplo,  de  tos  giros  de  +/-45i' 
cuando  se  ha  conseguido  ya  que  la  cruz  sume  41. 
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líalas  dos  propiedades  ayudan  a la  resolución  del  problema  restnngien* 
do  rí  espacio  de  búsqueda.  Debido  a ello,  se  las  denomina  heurísticas.  La 
Importancia  de  este  problema  reside  en  ios  dos  técnicas  utilizadas: 

Descomposición  de  problema  en  subprobfemas- 
Asjgnación  de  heurísticas  a cada  subproblema. 


EL  8 Y EL  15-PUZZLE 

Estos  dos  problemas-juegos  forman  parte  del  conjunto  de  ejemplos  mis 
i lisíeos  dentro  del  área  de  la  IA  dedicada  a la  heurística.  Eí  planteamien- 
to del  juego  es  muy  sencillo: 

Se  posee  un  tablero  de  3 x 3,  dividido  en  9 cuadrados.  Ocho  de  estos 
1 1 ladrados  se  pueden  mover,  mientras  que  el  otro  es  un  hueco.  En  los  cua 
lirados  móviles  figuran  números  comprendidos  entre  el  I y el  8.  No  puede 
haber  dos  cuadrados  con  el  mismo  número.  Un  posible  estado  del  proble- 
ma es  el  expresado  en  la  figura  6, 


2 

8 

3 

1 

6 

4 

7 

5 

Fig.  6. 


El  juego  consiste  en  transformar  una  situación  inicial  cualquiera,  en  la 
cual  los  números  están  desordenados,  en  una  siiuación  final  que  debe  ser 
fijada  ames  de  empezar.  El  juego  se  va  desarrollando  al  mover  el  jugador 
las  piezas  o cuadrados  hasta  llegar  a la  situación  final  prevista. 

Los  movimientos  de  las  piezas  se  realizan  al  pasar  cualquier  número  ve- 
cino del  cuadrado  vacio  a ocupar  la  posición  de  éste.  Se  consideran  cua- 
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dios  vecinos  a aquellos  que  se  encuentran  inmediata  mente  arriba,  debajo, 
al  lado  derecho  y al  izquierdo.  En  la  figura  7 se  pueden  observar  los  mo- 
vimiento posibles  a partir  de  La  configuración  dada, 

Por  supuesto,  si  el  cuadro  vacío  se  encuentra  en  alguna  de  las  esqui- 
nas, sólo  existen  dos  posibles  movimientos.  ¥ si  el  cuadro  vacío  se  encuen- 
tra en  el  centro,  existen  cuatro  posibles  movimientos. 


%.  7. 


Este  problema  ha  recibido  gran  cantidad  de  tratamientos  dentro  de  la 
IA.  Dentro  de  ellos,  sólo  se  van  a (catar  en  este  libro  los  enfoques  de  las 
técnicas  heurísticas  y de  los  Sistemas  de  Producción, 

Antes  de  pasar  a describir  cada  una  de  ellas,  conviene  resaltar  la  idea 
de  que  no  todas  las  configuraciones  Iniciales  llevan  a una  configuración 
final  dada.  Aparentemente  sólo  la  mitad  de  las  configuraciones  iniciales 
pueden  llevar  a una  final  dada,  Es  decir,  si  se  parte  de  una  situación  ini- 
cial como  la  expresada  en  la  figura  8a,  se  posee  un  50  por  100  de  puse 
bifidade&de  llegara  la  situación  final  dada  pos'  la  figura  8b-  Todavía  se  está 
investigando  sobre  este  tenia;  la  búsqueda  de  un  algoritmo  con  el  cual, 
partiendo  de  una  situación  inicial  y otra  final,  se  sepa  que  están  conecta- 
das por  una  serie  de  movimientos  de  los  cuadrados  que  forman  el  puzzle. 
Sin  embargo,  como  se  explicará  más  adelante,  en  d I 5 -Puzzle  si  existe  di- 
cho algoritmo. 

Técnicas  heurísticas 

Si  la  técnica  utilizada  es  la  de  escalada,  lo  primordial  es  definir  la  fun- 
ción de  evaluación  que  ha  de  maxinnzarse  o minimizarse.  Este  punto  ha 
tenido  varios  enfoques. 
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El  enfoque  más  sencillo  es  el  que  expresa  la  Función  de  escalada  de  la 
m guíente  forma: 

f - ECj, 

donde  C,  esj,  *1  si  el  cuadro  i está  colocado  en  la  misma  posición  que 
en  la  que  le  corresponde  del  estado  final 

* 0 si  d cuadrado  i no  está  en  la  misma  posición. 

Como  se  observa,  esta  función  da  d número  de  cuadrados  colocados 
en  su  sitio.  Debido  a ello,  esta  función  ba  de  maximir-arse.  En  el  estado  fi- 
nal el  valor  de  la  función  ha  de  ser  8. 

Otra  variante  de  esta  función  es: 

f«lD„  ¡-¡.,,8. 

donde  D,  es:  * l si  el  recuadra  i está  descolocado  respecto  de  la  posl 
ción  que  le  corresponde  del  estado  final. 

* 0 si  el  cuadrado  i está  en  la  misma  posición. 

Esta  función  proporciona  el  número  de  cuadrados  descolocados  y,  por 
ello,  ha  de  minimizarse.  El  valor  de  la  función  en  el  eslado  final  ha  de  ser 
0.  En  la  figura  9 se  representa  el  camino  seguido  hasta  obtener  la  solución 
mediante  la  utilización  de  la  función  P.  Se  ha  de  tener  en  cuenla  que  en 
un  determinado  nodo  no  se  desarrollan  los  estados  visitados  anteriormen- 
te en  el  camino  de  éste  al  nodo  inicial.  Si  se  hiciera  esto,  provocaría  que 
Los  movimientos  se  desharían.  Es  decir,  se  podría  permitir  que  después  de 
mover  un  cuadra  hacia  arriba,  en  el  siguiente  movimiento  se  moviera  ha- 
cia abajo,  desandando  vi  camino. 

Esta  Función  encuentra  la  solución,  pero  no  siempre  de  forma  óptima, 
más  aun  cuando  no  se  puede  realizar  retroceso.  El  retroceso  se  puede  in- 
corporar si  se  desea.  Si  se  quiere  alcanzar  la  solución  de  forma  óptima, 
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|Mrt  nuf  recurrir  a los  métodos  de  búsqueda  informada  como  d dgontma 
A*  I ii  concreto,,  f representa  el  limite  inferior  de  h{n>,  Recuérdese  que 
la  función  que  estima  la  distancia  que  edite  entre  un  nodo  y el  o 
|M„  ,1'hIlik  meto  Es  válida,  por  tanto,  pero  no  es  la  mejor  que  puede  utili- 
rii  e!  algoritmo  A*.  Nilsson  (Nilsson,  1900)  comenta  otras  funciones 
que  mejoran  en  aproximación  a f.  Como  ejemplo  cita  la  Función: 

h(n)  - P<n)  + 3 * S(n), 


donde: 

P{n)  es  la  suma  de  las  distancias  que  existen  entre  las  posiciones  de 
lm  cuadrados  en  la  configuración  del  nodo  n y la  posición  dt  los  mismos 
rn  la  configuración  final 

S£n>  es  una  fundón  suma  de  los  siguientes  miembros: 

— se  suma  dos  por  cada  cuadrado  que  no  esté  situado  en  la  casilla 
central  y no  esté  seguido  por  su  sucesor  correcto, 

— no  se  suma  nada  por  cada  cuadrado  que  no  esté  situado  en  laca- 
silla  central  y esté  seguido  por  su  sucesor  correcto, 

— se  suma  uno  si  existe  un  cuadrado  en  la  casilla  central  y no  es 
el  vacio. 


Sistema*  de  Producción 

Se  va  a definir  un  posible  Sistema  de  Producción  que  obtiene  la  solu- 
ción. El  Sistema  de  Producción  va  a estar  formado  por: 

— Rase  de  Hechos,  constituida  por  dos  elementos: 

— Una  matriz  que  expresa  la  situación  actual  del  «puzzle*. 

— Un  elemento  que  contiene  la  posición  en  la  que  se  encuentra  el 
cuadrado  vacío  en  el  instante  considerado.  Se  expresará  de  la  for^ 
ma:  vacío  (fila,  columna). 

Esta  información  es  redundante,  pues  se  puede  extraer  de  la  matriz, 
pero  facilita  las  operaciones  del  Sistema  de  Producción. 

En  La  situación  inicial,  la  Base  dispondrá  de  la  siguiente  información 
para  el  ejemplo  considerado: 


Base  de  Hechos 


< 


, vacio  (3,  7)> 


Fiu  . W 
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— Bastí  de  Reglas,  que  contendrá  las  siguientes  reglas; 

SI  vacio(ij)  Y i # 1 ENTONCES  vaciofi-l  j> 

SI  vacio-fij}  Y i / 3 ENTONCES  vacio<i+lj) 

SI  vacícXij)  Y j # ] ENTONCES  vaeioíij-í) 

SI  vacíoíij)  Y j * 1 ENTONCES  vacio(ij+J) 

La  primera  regla  dice  que  si  el  vado  está  en  ía  posición  (ij>  y además 
no  se  encuentra  en  9a  primera  Fila,  entonce»  puede  moverse  un  cuadrado 
a la  izquierda.  Esta  acción  hará  que  en  la  Base  de  Hechos  desaparezca  el 
hecho  vacío(ij)  y se  sustituya  por  vaeío(i-I  j).  Al  mktnü  tiempo,  d sistema 
cambiará  la  configuración  de  la  matriz. 

Se  puede  observar  que  las  cuatro  reglas  expresan  los  cuatro  movimien- 
tos; arriba,  abajo,  izquierda  y derecha.  Está  claro  que  en  la  mayoría  de  las 
ocasiones  existirá  conjunto  conflicto  que  tendrá  que  resolver  la  Estrategia 
de  Control 

— Estrategia  de  Control.  En  este  caso  se  puede  utilizar  la  mayoría  de 
las  técnicas  estudiadas  en  el  capitulo  4,  Sin  embargo,  en  este  problema 
una  de  los  mejores  estrategias  es  realizar  la  resolución  del  conjunto  con- 
flicto mediante  la  aplicación  de)  algoritmo  A*.  Para  aplicar  este  algoritmo 
se  puede  utilizar  cualquiera  de  las  técnicas  heurísticas  anteriormente  des 
critas  en  este  capitulo.  El  funcionamiento  del  Sistema  de  Producción  ter- 
minará cuando  en  la  Base  de  Hechos  aparezca  la  matriz  correspondiente 
al  estado  final,  o cuando  no  se  pueda  aplicar  ninguna  regla  Esto  ultimo 
indica ria  que  las  dos  configuraciones;  inicial  y final r no  estaban  co- 
nectadas. 


Problema  del  »1S  Puzzle» 

Para  este  problema  se  puede  aplicar  cualquiera  de  las  técnicas  vistas 
en  c!  apartado  anterior.  Pero  no  sólo  eso,  sino  que.  por  medio  de  un  algo- 
ritmo determinado,  se  puede  saber  si  desde  una  posición  o estado  inicial 
dada  se  puede  llegar  a obtener  una  posición  final  dada.  Esto  define  clara- 
mente el  problema.  Asi,  al  comenzar  la  ejecución  del  programa  que  lo  re- 
suelva, se  ejecutará  dicho  algoritmo,  Si  el  resultado  de  la  evaluación  es 
correcto,  se  podrá  continuar  con  el  programa.  En  caso  contrario,  no  se 
debe  empezar,  pues  no  se  Hegaria  a la  situación  ganadora. 

El  algoritmo  consiste  en  lo  siguiente  Se  calcula  el  número  de  cuadra- 
dos que  no  se  encuentran  en  su  posición  final  Si  este  número  es  impar, 
el  problema  tiene  solución,  En  caso  contrario,  no  tiene  solución. 


LA  FALSA  MONEDA 


|„  descripción  del  problema  es  la  siguiente:  se  dispone  de  n monedas. 
Iodo*  ellas  pe-san  lo  mismu  menos  una.  Se  ¡rata  de  obtener  el  n“™*™ 

,1„.  mínimo  de  pesadas  con  el  cual  es  postble  determmar  qui  moneda  es 
u tille  pesa  diferente.  Se  dispone  para  ello  de  una  balanza. 

Pura  resolver  el  problema,  se  supondrá  que  la  moneda  que  pesa  dtle- 
leme  os  más  ligera  que  las  otras.  El  suponer  que  es  más  pesada  no  supon- 
dnu  ninguna  dificultad  adicional,  puesto  que  la  solución  es  análoga  a la 
um  se  irátara  en  este  capítulo.  Se  ha  logrado  demostrar  que  el  mínimo  mi- 
t Lu  de  pesadas  necesarias  para  llegar  a determinar  la  moneda  falsa  con 
r"»  condiciones  es  min  (k/n^).  Un  problema  similar  se  plante,  -man- 
do no  se  sabe  si  La  moneda  de  peso  diferente  es  más  pesada  o más  Lign 

Esie  problema  va  a resolverse  utilizando  la  técnica  de  escalada.  Para 
ello  se  necesita  una  función  de  evaluación  que  hay  que  maximizar  o mi- 
, u o tizar.  En  concreto,  una  de  las  funciones  de  evaluación  que  mejores  re 
quitados  da  para  este  problema  es  la  siguiente; 

f.Nfl*PB+  Nd-P, 

donde: 

_ es  el  número  de  monedas  cuyo  peso  es  desconocido  después  de 
efeciuar' una  pesada,  dado  que  la  balanza  se  ha  nivelado. 

_ Nj  es  el  número  de  monedas  cuyo  peso  es  desconocido  después  de 
efectuar  una  pesada,  dado  que  la  balanza  se  ba  desnivelado. 

- P es  la  probabilidad  de  que  la  balanza  se  nivele. 

_ P ] es  la  probabilidad  de  que  la  balanza  se  desnivele. 

Por  tanto,  esta  función  expresa  el  número  medio  o esperado  de  mone- 
das desconocidas  después  de  efectuar  una  pesada.  Esto  implica  que  había 

que  minimizarla-  c 

A continuación  so  pondrá  un  ejemplo  para  clarificar  e tema.  Se  parte 
de  24  monedas  de  las  que  una  moneda  pesa  menos  que  las  demas.  bajo 
«tts  en  ti  ico  [íes  esc  (unción  de  escalé  si  llega  a obtener  el  numero  me- 
dio mínimo  v será  la  prohindidad  del  árbol  que  se  conslraira. 

Si  se  colocan  diferentes  números  de  monedas  en  los  brazos  de  la  &a 
lanza  no  se  obtendrá  ningún  resultado  importante  o por  lo  menos  exis- 
ten pocas  probabilidades  de  obtenerlo.  Por  tanto,  se  han  de  pesar  un  nu- 
mero par  de  monedas  en  cada  pesada,  de  forma  que  en  cada  plato  de  la 
balanza  se  disponga  de  igual  número  de  monedas.  Si.  por  ejemplo,  se  pe- 
san 12  monedas  con  las  aíras  I 2,  *o  extraerá  la  siguiente  mtormación.  El 
número  de  monedas  cuyo  peso  es  desconocido  después  de  la  pesada  es  12. 
Si  la  balanza  se  inclina  hacia  la  derecha,  se  sabe  que  ahí  no  esta  la  mone- 


- SttlttSZZtZXZ  --—pese.  Con  locual, 
qur  menos  pesa).  No  puede  suceder  oue  “ 12  (J“  dcl  moiitón 

^ ■“***■  t ^ Sl™zzi* p,,es,<' quc 

U función  de  evaluación  en  «te  caso  vajdrfa^ 

f-  0 + 12  * I - \lf 

siendo;  pB  - 0 
Nj-  12 

?4  - 1 

resulíTd^  l.'a^Mda'Mrian'  * P<!SÍ"’  " mon*,das  cm  olr»»  ti.  Los 

pu^r™  5*'“"  " nÍVdaM  ■ 2' 

- Número  de  monedas  desconocidas  ílihalí*  ?“*  1"°  " kpcsaronj 
puesto  que  la  moneda  Falsa  estaría  en^l  mlfn^  ¿«tildase  - 1 1, 
sabría  el  peso  de  todal  l„  ,wf.  e"  *’  m°n,án  -ue  mt,nos  PeMra  í « 

— Probabilidad  de  que  la  balanza  se  nivele  - a iva  u i 
probabilidad  de  que  la  moneda  falsa  sea  una  de  | afd™  ™ * mlS,na  qUe 

- Probabilidad  de  que  la 

^probabilidad  de  que  U moneda  fal*  JT¡^22  q“^ 
En  este  caso,  la  (Unción  de  evaluación  tomaría  el  valor 
f - 2 * 2/24  + 1 1 * 22/24  - 10.25. 

1 1 cConT  ‘¿TS  »ara  13  "«*•«•*.  del  problema  pesar 

»nsi  írt para  ias  ^ * 10  >o. . 

mer  nivel  del  árbol  de  büsqueda  f0rTnBr<!Í  ^ 


Fie,  n 
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A continuación.  según  la  técnica  de  escalada,  se  seguirá  exploirnidopor 
l,  j(tini,  que  posea  la  función  de  escalada  menor.  En  este  caso  es  el  8.  Des- 
de  efectuar  el  mismo  proceso  de  pendas,  e!  valor  menor  de  la  fun- 
! l„  da  la  rama  de  las  1 monedas.  Por  último  se  puede  comprob^  que 
I..  maúlenle  pesada  se  localizara  la  moneda  falsa.  Esto  « debido  a que 
„ potarnos  tres  monedas  con  otras  tres  pueden  suceder  dos  casos; 

Íji  balanza  se  equilibra  con  lo  cual  sólo  se  desconocerá  el  peso  de 
(|m  monedas.  Esto  hace  que  en  la  próxima  pesada  se  sepa  cuií  es  la  falsa 

ntuneda-  . . _ 

La  balanza  se  desequilibra  por  lo  que  habrá  tres  monedas  cuyo  peso 
....  desconocido.  Con  pesar  1 con  1 en  la  siguiente  pesada,  se  sabrá  cuál 

rn  la  moneda  falsa. 

Al  final  del  proceso  se  obtendré  el  árbol  de  la  Figura  2-  La  solución  en 
s ,1c  caso  es  3 pesadas  como  número  medio  mínimo  de  pesadas  para  des- 
cubrir la  moneda  falsa. 


LAS  TORRES  DE  HANOI 

£1  juego  de  las  Torres  de  Hanoi  o de  los  discos  esta  tomado  de  la  tra- 

pran’r emplo  de  Benarés.  bajo  el  domo  que  marca  el  cenW»  del 
mundo,  yace  una  placa  de  latón  a la  que  están  lijadas  tres  agujas  de  día 


7 


d ';oüo  de  «Ito  e»d*  una.  y del  grosor  del  cuerpo  de  una  abeja 
En  orno  □ estas  agujas,  Dios,  en  el  acto  de  ia  Creación,  rol ocoTJnYa  v 

y d«m?en°dndn°™  PU™'  dc*a,n5ando  ei  maV°r  sobre  la  placa  de  latón 
nil„cí',d  Progresivamente  los  demis  conforote  se  asciende  por  la 

pll  vm  SÍT  DlS  í t’'0Ch<!'  C*“r’ 105  Mcerdo<«  dehcm. 

r ? Sñ"  ndü  °S  dlsc“ ,dlf  una  asuja  de  diamante  a otro,  de  acuer- 
do  con  las  leyes  fijas  e inmutables  de  Brahma,  que  exigen  que  el  oficiante 
no  deba  mover  mas  de  un  disco  por  vez  y que  deba  situar  tal  disto  en  otra 
agu  a sin  que  quede  por  debajo  de  él  discos  más  pequefios.  Cuan*,  los  « 
senu,  V cuatro  discos  * hayan  transferido  de  la  £guja  en  que  D^oTlos  ct 
loco  en  la  Creación  a una  de  as  otras,  la  torre  el  templo  vi™  n„kj„i 

■ — » - ¿zfsmrJSsn 

'•  5010  “ Pucde  traslad*r  un  disco  en  cada  movimiento: 

*...el  oficiante  no  debe  mover  mis  de  un  diseo  por  ve*,... 

, J0  dB  ™>°r  radio  "u"«  ****  «I-  por  encima  de  otro  de 

mis" 'pequefios S“  qUC  <»ueden  P°r  deb»j°  de  él  discos 
y su  finalidad- 

Reconstruir  la  torre  en  otra  de  las  varillas: 

en  ;i;í.C¡Tdr  lM  rTla  V,  ™atm  di,cos  *■=■  h*.«"  «««fcréta  de  la  aguja 
en  que  Dio*  los  colocó  en  la  Creación  * 

veri  l'“,C'Sr  *' jUe*°'  Pl  Primer  disco  que  se  mo- 

verá será  el  mas  pequeño,  ya  que  es  el  único  que  se  puede  mover. 


72 


l n el  siguiente  paso  se  presentan  Job  posibilidades:  mover  el  disco  pe- 
quen.- n la  oirá  varilla  libre  (poco  aconsejable)  o mover  el  segundo  disco 
tltriule  la  torre  a la  varilla  libre  (que  es  más  tónico).  Es  evidente  que  no  se 
pudra  colocar  sobre  la  varilla  ocupada  por  el  disco  más  pequefio,  porque 
«r  violarla  la  regla  número  dos, 

A partir  de  este  paso,  nu  es  tan  obvio  lo  que  se  tiene  que  hacer,  ya  que 
I,,*  pi -"tibíes  moví  miemos  aumentan  y sólo  alguno  de  ellos  lleva  directa- 
mente  a la  solución.  Aun  si  en  todos  los  casos  se  escogiese  d movimiento 
, HinectUj  se  necesitarían  2 * - l para  alcanzar  la  solución,  siendo  n el  nu- 
men i de  discos  que  componen  la  torre. 

Después  de  jugar  un  rato  con  la  torre  de  cinco  pisos  se  puede  observar 
que  aparecen  de  liempo  en  tiempo  torres  de  dos,  tres  o cuatro  pisos  y se 
puede  detectar  una  cierta  regularidad  en  La  formación  de  estas  torres.  Es- 
hv.  pumas  pueden  llevara  descubrir  el  mecanismo  de  resolución  del  juego. 

fj  método  que  se  va  a utilizar  está  basado  en  la  descomposición  de  pro- 
blemas irresolubles  en  subpr  oble  mas  que  si  pueden  resolverse.  Esls  idea 
ph  la  base  fundamental  del  nesolutor  general  de  problemas  explicado  en  ca- 
pítulos anteriores. 

Si  el  problema  que  se  está  tratando  es  hacer  una  torre  de  cinco  pisos, 
sc  puede  descomponer  en  tres  subproblemas:  hacer  una  torre  de  cuatro  pi- 
„ * aladar  el  disco  mas  grande  a la  varilla  libre  y hacer  una  torre  de  cua- 
m/piKw  encimo  dei  disco  grande.  Con  lo  cual,  la  solución  se  reduce  a 
i i instruir  dos  torres  de  cuatro  pisos  convenientemenlc- 

Este  problema  tampoco  es  posible  resolverlo  directamente,  pero  se 
puede  aplicar  de  nuevo  la  estrategia  de  división,  ya  que  para  hacer  una 
u.ne  de  cuatro  pisos  sólo  es  necesario  realizar  tres  pasos:  hacer  una  torre 
,Jc  ires  pisos,  trasladar  el  disco  número  cuatro  y realizar  la  torre  de  tres 
pisos  encima  de  dicho  disco  Sí  se  aplica  este  método  reiteradamente  He 
y.#  un  momento  en  que  los  movimientos  que  hay  que  realizar  son  elenien- 
ules,  con  lo  cuai  se  pueden  hacer  directamente,  cuando  se  realice  una  torre 
de  dos  discos.  Una  vez  construida  la  torre  de  dos  pisos,  se  puede  realizar 
h de  tres,  luego  la  de  cuatro  y,  finalmente.  la  de  cinco. 

El  método  utilizado  se  puede  formalizar  de  la  siguiente  manera: 

Trasladar  una  torre  de  N pisos  de  la  varilla  X a la  varilla  Y: 

J . Trasladar  los  N-l  pisos  superiores  a la  varilla  librc, 

2,  Trasladar  el  disco  más  grande  a la  varilla  Y. 

3,  Trasladar  los  N-l  discos  superiores  desde  la  varilla  libre  hasta  la  va- 
rilla Y. 

Este  procedimiento  es  necunsivo,  ya  que  en  la  definición  de  U solución 
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£1s*£s~'ueión- Falw  eslabl— «***  * («** 

Si  la  torre  es  de  un  solo  piso: 

1.  Trasladar  el  disco  desde  la  varilla  Xa!a  Z. 


t 


Esto  desarrollado  en  U5P  sena: 


í hZPUU  TO  H H EfALTjy  ftAQflJO  UH  DjSTtNO  A.  ü X 


"d“  b °PeraCÍÓn  de  *“  el  "rim"  ORI. 
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í>uiíá  el  procedimiento  recursivo  sea  complicado,  pero  no  importa, 
Ismibitn  existe  una  solución  iterativa  al  problema: 

í Trasladar  el  disco  pequeño  a la  varilla  consecutiva  en  el  sentido  de 

las  agujas  del  reloj, 

2 Traslación  de  cualquier  disco,  a excepción  del  mínimo. 

Este  segundo  paso,  aunque  parece  poco  restrictivo,  en  d fondo  sí  que 
lo  es,  ya  que  sólo  una  pieza  cumple  la  condición  en  cada  momento,  y iraO 
una  varilla  donde  mover  dicha  pieza,  yaque  la  oirá  tiene  en  su  cima  el  dis- 
co pequeño, 

J LABERINTO 

La  mitología  griega  relata  que  el  héroe  Teseo  entró  a un  laberinto 
para  hallar  y malar  al  monstruo  Mmotauru,  Le  ayudó  Ariadna.  quien  le  dio 
un  ovillo  de  hilo,  Teseo  Fue  desenredándolo  conforme  se  adentraba  en  el 
laberinto,  mientras  Ariadna  sujetaba  uno  de  los  extremos  del  hilo.  Des- 
pués, ai  enredar  de  nuevo  el  hilo,  halló  fácilmente  la  salida. 

Se  relata  esta  antigua  leyenda  por  su  semejanza  con  un  invento  llama- 
do -el  ratón  en  el  laberinto»,  que  hizo  el  matemático  e ingeniero  amen- 
V ano  C laude  Shannan,  El  -ratón*  se  coloca  en  una  posición  dentro  de  un 
laberinto  especial  y otro  objeto,  que  podría  llamarse  un  «trozo  de  queso*, 
ve  coloca  en  otra  posición.  El  ratón  anda  por  el  laberinto  siguiendo  un  ca- 
mino tortuoso  hasta  que  encuentra  el  -quesu»,  pero  después,  si  se  coloca 
de  nuevo  en  la  misma  posición  de  partida,  se  dirigirá  diréctamenie  hacia 
el  «queso-  sin  desvío  alguno. 

Se  va  a considerar  un  problema  relacionado  con  la  búsqueda  de  un  ca- 
mino a través  de  un  laberinto  (o,  más  correctamente,  una  clase  de  teles 
problemas)  y se  desarrolla  un  procedimiento  que  resuelve  este  clase  de 
problemas, 

Se  puede  pensar  en  el  laberinto  como  un  sistema  finito  de  uniones,  de 
las  cuales  emanan  los  corredores.  Cada  corredor  enlaza  dos  uniones  {que 
se  llaman  adyacentes).  También  pueden  existir  uniones  de!  upo  «callejón 
sin  salida».  De  los  cuales  parte  un  solo  corredor.  El  laberinto  puede  repte* 
sentarse  geométricamente  por  un  graío  donde  los  corredores  están  repre- 
sentados por  arcos  y los  cruces  por  nodos. 

Para  construir  el  procedimiento,  se  usa  un  método  especial  de  búsque- 
da. En  cada  paso  de  la  búsqueda  pueden  separarse  los  corredores  en  tres 
clases:  aquellos  por  tos  que  Teseo  nunca  ha  pasado  (libres),  aquellos  por 
los  que  ha  pasado  una  vez  [gemilibrcs)  y aquellos  por  los  que  ha  pasado 
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dos  V0MS  (cerrados).  Además,  desde  cualqmer  unión,  Tcseo  puede  mover, 
se  hacia  una  unión  adyacente  de  una  de  las  dos  maneras  siguientes; 

. 7 desenredando  el  hilo,  leseo  se  mueve  a lo  largo  de  cualquier  corre- 
dor  libre  hasta  una  unión  adyacente,  desenredando  el  ovillo  de  Anadna 
o «forme  avanza  después,  este  corredor  se  considera  como  semilibre, 

mrlnh  JrrTlredand0"  * h3l0t  TcSCO  ”*&***  a io  larE°  dtr  un  corredor  se- 
£52  5?  “ "ntón  enredando  el  hilo  conforme  avanza; 

después,  este  corredor  se  considera  cerrado. 

Se  supone  que  leseo  no  avanzará  por  los  corredores  que  estén  cerra- 
dos,  y que  puede  señalar  en  qué  estado  se  encuentra  cada  corredor.  La 
»e  Cada  m«v'miento  depe nde  de  las  condiciones  que  encuentra 
leseo  al  llegar  a una  unión.  Estas  condiciones  pueden  ser  algunas  de  las 


1,  Que 

2,  Que 

3,  Que 

4,  Que 

5,  Que 

A partir 
búsqueda: 

St  I 
SI  2 

si  3 
SI  A 
SI  5 


encuentre  d Minotauro. 
encuentre  el  hilo.  Esto  indica  que  ya  ha  pasado  por  esa  unión, 
haya  por  lo  menos  un  corredor  libre  que  pane  de  la  unión 
se  encuentre  con  Ariadna. 
ocurra  cualquier  otra  cosa, 

de  estas  cinco  condiciones  se  puede  describir  d método  de 


ENTONCES 

ENTONCES 

entonces 

ENTONCES 

ENTONCES 


Detenerse. 

Enrollar  d hilo  en  el  ovillo  hasLa  la 
unión  anterior. 

Seguir  por  e]  comedor  libre. 
Detenerse. 

Enrollar  el  hilo  en  d ovillo  hasta  Ja 
unión  anterior. 


Al  encontrarse  en  una  unión  cualquiera,  leseo  decide  su  próximo  mo- 
vimiento de  la  siguiente  forma:  ejecuta  Ja  primera  condición  qu(-  se  cum- 
pla de  acuerdo  al  orden  establecido  en  las  reglas. 

. mediante  un  sencillo  Sistema  de  Producción 

donde  la  base  de  hechos  estará  compuesta  por  el  grafo  y las  condiciones 
que  se  den  en  cada  nodo,  asi  como  la  posición  de  los  tres  personajes  La 
base  de  reglas  es  la  expuesta  anteriormente.  Y h estrategia  de  control  con- 
siste en  aplicar  Ja  primera  regla  que  se  cumpla. 


= MISIONEROS  Y CANIBALES 


En  la  Orí  Hit  Izquierda  de  un  río  hay  « misioneros  y n canibales  Los 
misioneros  quieren  pasar  a los  caníbales  a la  oIra  orilla,  para  lo  que  dis- 


punen de  una  barca  que  sólo  tiene  capacidad  para  dos  personas.  En  nin- 
Kiinu  orilla  puede  ser  mayor  el  número  de  misioneras  que  de  caníbales, 
puesto  que  de  no  ser  asi  los  caníbales  se  comerían  a los  misioneras, 

Vn  a realizarse  la  resolución  del  problema  en  base  a un  Sistema  de  Pro- 
diu  ción.  El  estado  del  problema  después  de  cada  moví  miento  puede  ex- 
pnsuso  en  forma  de  lista.  Esta  lista  podría  representarse  como  sigue: 
(MI.  Ch  MB,  CB,  ORILLA) 

dundese  incluyen  el  número  de  misioneros  y caníbales  en  la  orilla  izquier- 
da (MI  y €1),  asi  como  los  misioneros  y caníbales  en  la  barca  (MB  y CB)  y 
ln  orilla  en  que  se  encuentra  la  barca  (ORILLA). 

En  cada  momento  pueden  calcularse  fácil  mente  el  número  de  caníba- 
les v misioneros  en  la  otra  orilla.  El  problema  consiste  en  pasar  del  estado 
inicial  O,  3, 0, 0,  Izq)  al  estado  (0,  0. 0, 0.  Der)  en  el  que  los  caníbales,  mi- 
«iimeros  y barca  están  en  la  orilla  derecha. 

Pana  pasar  de  una  onlla  a otra  son  necesarios  una  sene  de  mqvimien 
ios  que  pueden  expresarse  en  forma  de  reglas  de  producción.  Algunas  de 
las  reglas  correspondientes  a cada  movimiento  son: 

* Subir  un  misionero  a la  barca: 

(Izq)  (MJ  - I £ Cl)  (MB  + CB  + 1^2)  — (MI  - l.  CI,  MB  + 1,  CB,  Izq) 

Si  la  barca  está  en  la  orilla  izquierda,  quedan  más  misioneros  que  ca- 
níbales en  la  orilla  izquierda  y la  barca  no  está  aun  llena,  entonces  subir 
un  misionero  a la  barca. 

* Subir  un  caníbal  a la  barca: 

(Izq)  (CI  > 0)  (MB  + CB  +1<2}  - (MI,  CI  - 1.  MB,  CB  + i.  Izq) 

Si  la  barca  está  en  la  orilla  izquierda,  hay  algún  caníbal  cu  la  orilla  iz- 
quierda y la  barca  no  está  aún  llena,  entonces  subir  un  caníbal  a la  barca. 

* Cruzar  el  rio; 

(Izq)  (MB  4 CB>0)  —(MI,  CI,  MB,  CB,  Der) 

Si  la  barca  está  en  la  orilla  izquierda  y no  está  vacia,  entonces  pasar  a 
la  orilla  derecha. 

(DER)  fMB+CB  ) 0)  — (MI,  CI,  MB,  CB,  Izq) 

Si  la  barca  está  en  la  orilla  derecha  y no  está  vacía,  entonce*  pasar  a 
Ja  orilla  izquierda. 

* Bajarse  en  el  lado  derecho: 

(Der)  (3  - (MI  + MB)  >3  - (CI  + CB)  + I)  (3  - (MI  + MB)  > 0)  —(MI, 
CL  MB.  CB  - 1,  Der) 

Si  la  barca  eslá  en  el  lado  derecho,  hay  un  caníbal  en  la  barca  y hay  su- 
ficientes misioneros  en  la  orilla  derecha,  entonces  bajar  un  caníbal. 

(Der)  (3  - {MI  + MB)  - 0)  (CB  > 0)  (MI,  Cl.  MB,  CB  - I,  Der) 
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Si  la  barca  está  en  el  lado  derecho,  hay  un  caníbal  en  k barca  v no  hav 
ningún  misionero  en  la  orilla  derecha,  entonces  bajar  un  caníbal 

(Der)  (ME  - 1 ^ CB)  (MB  > 0}  ->  (Mí,  CI,  MR  - 1,  CE,  Der) 

Sí  la  barca  está  en  el  lado  derecho,  hay  misioneros  en  la  barca  y al  ba- 
J™  un  misionero  quedara  mayor  o igual  número  de  misioneros  que  ca- 
níbales, entonces  bajar  un  misionero  de  la  barca. 

La  condición  de  finalización  viene  expresada  como: 

(Der)  (3  - (MB  + MI)  - 3)  (3  - (CB  + CI)  - 3)  - FIN 

Si  están  la  barca.  Jos  tres  misioneros  y los  tres  caníbales  en  la  orilla  de 
recha,  entonces  se  ha  llegado  a la  solución. 

0ÍLSf  Hechos  inicial  mente  estará  constituida  por  tos  estados  ini- 
cía  y h nal.  La  Base  de  Reglas  contiene  las  reglas  correspondientes  a los 
movimientos. 

Para  la  resolución  del  conjunto  conflicto  puede  utilizarse  como  estra- 
tegia de  control  la  técnica  de  búsqueda  en  amplitud.  A lo  largo  del  proce 
so  se  |nc  uiráis  en  la  Base  de  Hechos  los  estados  a los  que  se  pasa  después 
de  aplicar  las  reglas,  comprobando  si  coinciden  con  el  estado  final  ¡ndui- 
oen  la  Base  de  Hechos.  Sí  esto  fuera  así,  el  procedimiento  concluye  des- 
cribiendo rl  camino  existente  desde  el  nodo  meta  hasta  d nodo  inicial  a 
través  de  todos  sus  antecesores.  Dicha  descripción  puede  llevarse  a cabo 
establee] endo  un  puntero  desde  cada  nodo  a su  nodo  antecesor, 

Un  camino  que  lleva  a la  solución  es: 
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Fig,  13  k 


A continuación  se  expone  una  forma  sencilla  de  programar  este  pro- 
blema, Como  ya  se  indicó  en  la  notación  de  ks  reglas,  cada  estado  del  pro- 
blema se  representará  por  una  lista.  En  la  Base  de  Hechos  irán  introdu- 
ciéndose sucesivamente  todos  los  estados  por  los  que  pasa  la  resolución 
del  problema 

El  procedimiento  que  crea  la  Base  de  Hechos  inicia!  podría  sen 


( DEFÜN  COMIENZO  MIL 

nsíj 

•®fL 


BH  í LlSt  í LIST  MJ  CI  MB  CB  ORI  i )) 


En  cuanto  a las  reglas,  tendrán  dos  partes  diferenciadas:  una  parte  an- 
tecedente de  condición  de  aplicación  de  la  regla  y otra  consecuente  de 
acción. 

Para  determinar  si  una  regla  es  aplicable  o no,  se  establecerá  una  fun- 
ción ■boolenna-  que  compruebe  la  condición  y devuelva  T o NIL,  depen- 
diendo de  si  la  regla  es  aplicable  o no. 

Por  ejemplo,  para  La  regla  que  cruza  el  rio  de  la  orilla  derecha  a la  iz- 
quierda, dicha  función  lógica  serla  CGND3; 


t DEFÜN  COMDS  ( L } _ , 

1 *nd  { | m(U01>or  l„  o,n 

Si  esta  regla  se  aplicara,  se  llamará  a una  función  que  modifica  el  es- 
lado  actual.  Para  la  regla  anterior  sería: 

(DEFÜN  ACCION*  NtL 
( SETQ  ORI  'l*q  } ) 
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U *ürma  máA  wndlla  de  realizar  las  inferencias  seria  comprobar  *u 
chivamente  cada  una  tic  tas  condiciones  (CONOS,  CON 02,  de  jas  re 

gJas,  aplicando  aquella  acción  (ACCION!.  ACCI0N2,  que  corresponda 
a la  primera  condición  que  ac  ha  satisfecho.  Habrá  que  comprobar,  en  pri- 
mer lupr.  m ya  se  ha  alcanzado  el  estado  final  (O,  O,  O,  O,  Oer)  y si  no  las 
condiciones  de  las  reglas  ordenadas  de  mayor  a menor  orden  de  priori 
dad.  Todo  esto  se  puede  realizar  con  la  función  MI5CAN. 


i DEFUN  MISCAN  NJL 

ÍcondBOOLT} 


presa 

f í C0ND3  í CAB 


SI)  íüegioüíjj 

aan  íacckhoÍ) 


onHiimiip 


í í CÜtfDa  ( CÁ¿  Bíí ) l TACCIONn ) J ) 

^ f PípT  ’I  NO  SE  PUEDE  APLICAR  NINGUNA 

_ f SETO  BOO  L N1L1JJ 
í CÜND { BOOL 

f SgflPíffff { UST  Mí  ct  cs  OR°  n 


Se  sugiere  al  lector  que  realice  las  modificaciones  oportunas  si  quiere 
que  Ja  resolución  del  conjunto  conflicto  sea  mediante  búsqueda  en 
amplitud. 


= EL  JUEGO  DE  LAS  OCHO  REINAS 

El  juego  o problema  de  tas  ocho  reinas  constituye  un  ejemplo  muy  co- 
nocido de  la  utilización  de  métodos  de  programación  de  tanteo  sisíemáti- 
co,  es  decir,  de  prueba  y error  También  es  un  buen  ejemplo  de  la  utiliza- 
ción de  Jos  procedimientos  de  vuelta  atrás  o retroceso, 

Este  juego  fue  investigado  por  C,  F.  Causs  en  1350 ' aunque  no  llegó  a 
r eso  i ver  Jo  comp  lelamente,  ya  que  esic  problema  se  caracteriza  por  su  cs- 
™ adecuación  a una  solución  analítica,  U aparición  de  los  ordenadores 
ha  hecho  posible  la  resolución  dd  problema  de  forma  mucho  más  sencilla. 

Kl  planteamiento  del  juego  es  el  siguiente:  hav  que  situar  ocho  reinas 
en  un  tablero  de  ajedrez  de  forma  que  ninguna  de  ellas  pueda  actuar  so 
bre  cualquiera  de  las  otras  con  arreglo  a las  restricciones  de  movimientos 
de  las  reinas  en  el  ajedrez.  Es  decir,  es  necesario  tener  en  cuenta  que  de 
acuerdo  con  estas  reglas,  una  reina  actúa  sobre  todas  la*  piezas  situada.»! 


SO 


en  la  misma  columna,  fila  o diagonal  del  tablero,  De  dio  se  deduce  inme- 
diatamente que  cada  columna,  fila  o diagonal  puede  contener  una  única 
reina. 

lina  forma  de  resolver  el  problema  consiste  en  ir  colocando  las  reinas 
d.  una  en  una,  fila  por  fila,  en  las  columnas  que  vayan  quedando  libres  de 
Maque  De  esta  forma  las  posibilidades  de  colocación  de  cada  reina  van  dis- 
minuyendo según  se  van  situando  más  sobre  el  lablero  Esta  estrategia  no 
i «.induciría  a la  realización  de  un  buen  programa,  ya  que  en  el  momento 
en  que  alguna  configuración  pardal  dd  problema  viole  cualquiera  de  las 
i audiciones,  no  puede  rectificarse  añadiendo  más  reinas  al  lablero,  con  lo 
que  el  juego  se  bloquea  casi  cuando  acaba  de  empezar. 

Se  puede  seguir,  por  el  contrario,  una  heurística  que,  en  cada  situa- 
ción. permita  decidir  la  acción  que  parece  más  ventajosa  con  arreglo  a las 
l ¡nací  cris  ticas  del  problema,  Una  buena  heurística  en  este  caso  colocaría 
cada  reina  dejando  libres  tantas  opciones  como  sea  posible  para  colocar 
la*  reinas  posteriores.  Asi,  pues,  es  necesario  tener  en  cuenta  el  número 
de  cuadros  de  la  filas  vacías  que  no  son  atacados  por  las  reinas  ya  coloca- 
das. De  esta  forma  se  tendría  una  medida  de  la  bondad  de  una  situación 
dele r minada  mediante  la  función  f(a>  que  calcula  el  número  de  cuadros 
nn  atacados  si  se  coloca  una  reina  en  la  posición  a.  Calculando  la  función 
! para  todos  los  cuadros  de  una  fila  y eligiendo  aquel  que  da  resultado  ma- 
yor, se  puede  implemcntar  esta  heurística  en  un  programa.  Existen  tam- 
bién otras  heurísticas  que  pueden  representarse  de  forma  paree  ida. 

La  implenienlación  que  resuelve  el  juego  ha  sido  típicamente  un  pro- 
cedimiento de  búsqueda  con  vuelta  atrás.  Existen  muchas  versiones  del 
ji]c:go  en  casi  todos  los  lenguajes  de  programación  de  alto  nivel,  Algunos 
de  ellos  obtienen  una  única  solución,  mientras  que  otros  obtienen  todas 
las  posibles.  También  es  posible  la  programación  del  juego  en  LISP,  len- 
guaje propio  de  la  IA,  El  programa  tiene  la  siguiente  forma: 


( DEEUN  REINAS  ( TAMAÑO  } 

( PROG  í N « TABLERO) 


( SETQ  N 1 ) 

1,00 P « 

íis&r1 


í 11  fila 


;]•  columna 

COÑíM  ( CONFLICTO  N M > ( OO  DRBHACER-M  J ) } 
SETO  TABLERO  ( CQNS  ( LIST  N M } TABLERO  ) ) 


SETO  TABLERO  ( CONS  ( LIST  N M > TABLERO  >)  __  t 
CONO  ( { OREATERP  ( SETQ  H ( ADEM  N ) ) TAMAÑO  ) 
( PRINT  < REVERSE  ( TABLERO  ))  }> 

GO  LOOf'N  > 

DESHACER-N  _ 

í CONO  { ( JÍULL  TABLERO  } í RETUH.N  TERMINADO  ) > 
< T ( SET$  M ÍCADAR  TABLERO  ) ) 

( SETO  M ¡ CAAR  TABLERO  ) ) 


tí 


desha¿eímS 

t CONO “ 


TABLERO  ( CDR  TABLERO  ))  } ) 


“iáSHSffi SUSP  M < ADDl  M » 1 TAMAÍ*° > 

T ( QO  DESHACER- M ) })  > ) 


El  programa  no  resuelve  únicamente  el  problema  de  las  ocho  reinas, 
ya  que  admite  lo  especificación  del  tamaño  del  tablero,  con  lo  que  puede 
extenderse  el  juego  a un  tablero  mucho  mayor,  La  estructura  del  progra- 
ma  es  !a  de  vuelta  atrás  Hace  un  movimiento,  y si  no  encuentra  ningún 
prob  ema,  continúa  colocando  la  siguiente  reina.  Cuando  encuentra  algún 
problema,  por  ejemplo  que  no  puede  seguir,  deshace  los  movimientos  rea- 
lizados y vuelve  a intentarlo.  En  este  caso,  b represen tadón  del  tablero  se 
“*  ,ante  UT1Í1  ,ista  óu,?  contiene  pares  de  números  que  indican  la  .fila 
y la  columna  en  la  que  se  ha  colocado  una  reina.  La  función  que  decide 
si  existe  algún  problema  en  la  colocación  de  una  reina  en  una  determina- 
da posición  se  denomina  CONFLICTO.  Su  estructura  es  la  siguiente: 


í DEFUN  CONFLICTO  ( N M TABLERO  ) 

t fñun  i i uiu  i «mi  f>nA  % Xm  i 


í COND  ( ( NULL  TABLERO  ) NlL  í 

f í OR  ( AMENAZA  N M ( CAAR  TABLERO  ) f CADAR  TABLERO  ) ) 
f CONFLICTO  N M ( CDR  TABLERO  > > ) > j J U 


i DEFUN  AMENAZA  f I J A B ) 
( Qtt  1 Aj 


í=(-jj)í- 
c = i + J J ) c + 


A B ) ) 

abhíí 


¡Igual  fila 
¡Igual  caluma* 
¡Diagonal  SO  NE 
¡Diagonal  NO -SE 


La  función  CONFLICTO  utiliza  otra  fundón  auxiliar,  AMENAZA,  encar- 
gada de  comprobar  si  b posición  elegida  se  encucnira  amenazada  por  al- 
guna de  las  reinas  ya  colocadas  en  el  tablero. 

Cuando  el  programa  termina,  devuelve  Ja  lisia  TABLERO  con  las  posi- 
ciones en  las  que  están  colocadas  las  reinas,  y después  escribe  la  palabra 
TERMINADO,  Si  se  desea  una  respuesta  más  gráfica,  pueden  utilizarse  las 
siguientes  Funciones  que  dibujan  el  tablero  y las  reinas  situadas  sobre  él: 


í DEFUN  DIBUJA -TABLERO  ( TABLERO  ) 

1 PROG f TAMAÑO  i 

f SETO  TAMAÑO  [ LENGTH  TABLERO  ) ) 
f DIBUJA-TABLERO- AUX  TABLERO  ) ) ) 
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( DEFUN  DIBUJA-TASLERO-AUX  t TABLERO  } 

{ tfrfrí  ) 

« CADAR  TABLERO  } 1 ) 
í DIBUJ A-T A8LE RO-AU X (CDR  TABLERO  H }) ) 

( DEFUN  DIBUJA-TABLERO-SÜB  { COLUMNA  N ) 

‘ ^ *Mn**«n 

j DIBUJA-TABLERO-SUB  COLUMNA  ( ADD1  N i > Í ) ) 


También  es  posible  implcmentarel  programa  en  forma  recursiva  en  lu- 
gar de  utilizar  la  vuelta  atrás. 

FJ  juego  de  las  ocho  reinas  es  fácilmente  representare  y resoluble  me- 
diante un  sistema  de  producción.  Para  la  representación  del  problema  han 
de  ic nene  en  cuenta  las  diferentes  lilas,  colocando  una  reina  en  cada  una 
de  ellas,  guiándose  por  las  siguientes  reglas: 

Si  I - I entonces  (poner  reina  en  fila  1 columna  í)  (i  - 2) 

Si  1 • 1 entonces  (poner  reina  en  fila  1 columna  2)  {I  - 2) 

Si  I » 1 entonces  (poner  reina  en  fila  1 columna  3)  {I  - 2) 

Si  1 - I entonces  (poner  reina  en  fila  1 columna  4)  (I  - 2) 


Si  I ■ 2 entonces  (poner  reina  en  fila  2 columna  1)  (1*3) 
5í  T » 2 entonces  (poner  reina  en  fila  2 columna  2)  (I  - 3) 


Si  f ■ 8 entonces  (poner  reina  en  fila  8 columna  B)  (]  -8) 

El  efecto  de  cada  una  de  las  reglas  es  la  colocación  de  una  reina  en 
una  determinada  posición  y el  paso  a la  fila  siguiente  para  examinar  las  po- 
siciones libres.  El  índice  L es  el  que  corresponde  a la  fila  que  se  examina 
en  ese  momento.  Como  puede  observarse,  en  cada  momento  pueden  apli- 
carse varías  reglas.  Para  resolver  el  conflicto  y elegir  sólo  una  de  ellas  se 
hace  uso  de  una  función  que  evalúa  b conveniencia  de  cada  posición.  La 
(unción  se  define  de  la  siguiente  forma: 

diagfi,  j)- longitud  de  la  diagonal  más  larga  que  pasa  por  la  casilla  0 j) 

Como  ya  se  indicó  en  la  descripción  del  juego,  una  buena  estrategia 
consiste  en  la  elección  de  la  posición  que  deje  el  mayor  número  de  casi- 
llas sin  atacar.  La  Función  descrita  ilustra  una  manera  de  cuantiftear  tal 
estrategia. 

La  resolución  del  conflicto,  por  tanto,  se  hará  eligiendo  la  regla  cuya 
aplicación  (colocación  de  una  reina  en  una  casilla  concreta)  produzca  un 
valor  menor  de  la  función  D1AG.  En  el  caso  de  que  existan  dos  valores  mi- 
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nimos  con  dos  regías  diferentes,  se  aplicará  aquélla  que  coloque  la  reino 
en  la  columna  situada  m As  a la  izquierda.  De  igual  forma  podría  elegir*? 
el  criterio  contrario,  y colocar  la  reina  en  la  columna  situada  más  a |n 
derecha, 


SOLITARIO 

Se  juega  sobre  un  tablero  de  33  agujeros  donde  al  principio  dd  juego 
lodos  los  agujeros  menos  el  central  están  ocupado*  por  clavos:  en  la  figu- 
ra Puede  verse  cómo  están  dispuestos  los  agujeros  y cuál  es  la  situación  tni- 
cial  Un  movimiento  consiste  en  hacer  saltar  un  clavo  sobre  el  adyacente 
situándolo  en  un  agujero  vacio.  El  clavo  sobre  el  que  se  saltó  se  extrae  deí 
tablero,  pasando  a estar  el  agujero  vacío.  El  objetivo  final  es  alcanzar  un 
es  o en  el  que  en  el  tablero  sólo  haya  un  clavo  en  el  agujero  central. 


r P“  uni  "»to  * *»  ayudan  a 5U 

En  cualquier  momento,  el  número  de  pasos  para  alcanzar  este  estado 
es  uno  menos  que  el  número  de  clavos  situados  en  el  tablero  Por  tanto 
habra  que  realizar  31  pasos  para  J]egar  a U „!ución. 

lia  estrategia  basada  en  un  árbol  de  búsqueda  las  m^íhl  l 

f ra  31  ">  »**  —-Si  ítoSnü 

gun  alguna  función  heurística  6 odüclr  poda,  se- 

Profundizando  en  la  geometría  dd  problema,  puede  observarse  que  un 
clavu  de,_du  adío  puede  d»  p«dcíou„  a io  h-.Tlo" 

ejes  tmnzonlal  y vertid];  asi  se  determinan  cuatra  tipos  de  agujeros,  se- 
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gnu  *c  muestre  en  la  figura  13,  de  tal  forma  que  un  clavo  en  un  agujero  som 
breado  sólo  puede  moverse  a otro  con  d mismo  sombreado. 


ffc  13 


Para  alcanzar  el  objetivo,  es  decir,  tener  un  único  clavo  en  el  centro, 
es  preciso  que  haya  al  menos  un  clavo  sobre  una  casilla  que  aparece  en  la 
figura  sombreada  de  negro.  Asi.  puede  aplicarse  un  movimiento  que  lleve 
un  clavo  al  centro. 

Por  tanto,  al  aplicar  todos  los  posibles  movimientos  a una  situación,  ha- 
brá que  rechazar  aquéllos  que  conllevan  la  eliminación  de  los  clavos  en 
casillas  negras,  suspendiendo  la  búsqueda  por  esa  rama.  Las  figuras  de  las 
páginas  siguientes  muestran  un  ejemplo. 

Teniendo  en  cuerna  estos  aspectos,  se  sugiere  al  lector  que  realice  el 
programa  que  simule  el  juego.  La  representación  del  tablero  se  hará  sobre 
una  matriz  en  donde  las  casillas  que  llenen  un  clavo  se  representaran  por 
un  uno  v las  que  no  lo  tienen  por  un  cero.  Para  realizar  los  movimientos 
habrá  que  estudiar  si  hay  tres  casillas  seguidas  en  todas  las  direcciones  con 
valores  I 1 0,  El  movimiento  en  si  consiste  en  sumar  “1,  -l,  I a las  casi- 
lias,  respectivamente. 


85 


86 


87 


JUEGOS  CONTRA  UN  7 
CONTRINCANTE  INTELIGENTE  J 


AJEDREZ 


W^L..  L ajedrez  es  u n juego  adecuado  para  tratarlo  mediante  téc- 

nicas de  1A  debido  a que  tiene  claramente  definidos  el  ob- 
jetivo que  quiere  alcanzarse  (el  mam)  y los  medios  para 
M llegar  a él  (los  movimientos  permitidos). 

■■■  Mo  es  el  problema  n,i  tan  simple  como  para  ser  trivial. 

ni  tan  complejo  como  para  ser  irresoluble.  Un  programa 
que  juegue  al  ajedrez  debe  reconocer  la  configuración  de- 
jas piezas,  los  movimientos  adecuados  y sus  consecuencias. 
Para  ello  precisa  gran  capacidad  de  almacenamiento  de 
información,  utilizando  otiuctum  que  permiun  llc»r  a conclusión» 

coherentes,  ,,  % , 

Asi  pues,  un  primer  problema  es  la  representación  en  a máquina  del 
tablero  de  ajedrez,  Claude  Shannon  sugirió  en  1949  que  cada  casilla  de!  la 
hiero  se  representará  en  d computador  por  una  palabra.  El  contenido  de 
^ta  palabra  será  el  indicador  de!  tipo  de  pieza  situada  sobre  la  casilla.  A 
cada  pieza  se  le  asigna  un  número  entero,  haciéndole  corresponder  a las 
blancas  los  números  positivos  y a las  negras  los  negativos,  be  representan 
bs  peones  por  un  uno,  Los  caballos  por  un  dos.  los  alfiles  por  tres  y asi  su- 
cesivamente. Us  casillas  vacias  se  representan  mediante  un  cero.  Utilizan- 
do este  sistema  puede  averiguarse  si  una  casilla  del  tablero  tiene  una  pieza 
o no.  v si  la  tiene  cuál  es  y de  qué  color. 

Para  poder  detectar  fácilmente  los  bordes  del  tablero  se  trabaja  con 
unas  dimensiones  hipotéticas  de  10  por  12  en  lugar  de  las  reales  de  S por 
S El  tablero  real  de  juego,  como  se  indica  en  la  figura  14.  tendrá  casillas 
numeradas  entre  22  y 99.  Las  demás  posiciones  corresponden  a casillas 
que  están  fuera  dd  tablera.  Estas  contendrán  un  número  que  no  va  a 
corresponder  a ninguna  pieza,  por  ejemplo,  99. 

Con  esta  representación  pueden  determinarse  los  movimientos  permi- 
tidos desde  cualquier  posición,  estableciendo  una  relación  matemática  en 
tre  las  distintas  casillas.  Por  ejemplo,  un  caballo  situado  sobre  cualquier 
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casilla  puede  realizar  ocho  mov, miemos  difcrenlcs.  Las  casillas  a las  Que 
™,?tTVerS*  !e,í'ie,n,en  5u™mdo  a la  (,osictón  0"  « encuentra  las 
' r *2V  + ,2>  .-»•  -«•  -21  y -12.  Si  un  caballo  está  en 
la  casilla  99  y se  aplica  el  movimiento  correspondiente  a sumar  +21,  pasa 
a Ja casóla  de  la  posición  120  que  contiene  un  99,  indicando  que  está  Fue 
ra  del  tablero  de  juego  y*  por  Lanío,  el  movimiento  es  incorrecto  Si  esto 
viera  en  a casiüa  59  y « le  suma  +2l,  + 13,  _ i9  y ^ a Eas  c|lS¡,Eaii 

n\4"  y 5l<  nnpecuvamemr,  que  están  ¡riera  del  tablero,  Do  Forma  M* 
mijar,  los  movimientos  del  rey  podrán  calculara  a partir  de  las  tantida- 
des:  -l,  +9,  + 10,  +J  lH  + lf  -9  _]0y 

Cuando  W realiza  un  movimiento  hay  que  comprobar  que  éste  es  váli- 
do. Si  Ja  posición  obtenida  contiene  d número  99.  el  movimiento  prupuev 
lo  es  incorrecto,  la  nueva  posición  está  fuera  del  tablero.  Si  se  ruega  con 
blancas  y b casilla  destino  contiene  un  numera  positivo,  no  podra  efec- 
tuarse este  movimiento  por  estar  ya  ocupada  por  otra  pieza  blanca.  5t  con- 
tiene un  numero  negativo.  Ja  pieza  blanca  podrá  situarse  en  la  casilla  cap- 
turando la  pieza  negra  que  hay  en  ella.  Si  la  nueva  posición  contiene  un 
ceior  el  movimiento  sera  correcto,  pues  la  casilla  está  vacia 

Los  movimientos  de  alfil,  torre  y reina  son  ligeramente  más  complica- 
dos.  Si  una  parte  de  un  alfil  blanco  situado  sobre  la  casilla  que  correspon 
de  a la  posición  S5  y se  quiere  estudiar  los  movimientos  correctos  sobre 


90 


una  de  las  diagonales,  deberían  tratarse  sucesivamente  las  posiciones  66, 

77  88.. ...  ó 44,  33,...  Para  cada  posición  comprobará  si  está  ocupada  por 
una  pieza  blanca  ó negra,  actuando  en  consecuencia.  Si  la  casilla  está  va- 
da  (en  la  posición  hay  un  cero),  puede  optara  por  mover  a a dicha  posi- 
ción o estudiar  el  movimiento  a la  posición  siguiente  en  la  diagonal.  De 
jornia  análoga  se  realizan  los  movimientos  de  las  torres,  y los  de  la  rema 
son  una  conjunción  de  ambos. 

Existe  otra  forma  de  representar  el  tablero  en  el  computador.  En  ugar 
de  asignar  una  palabra  para  cada  casilla,  se  asigna  dentro  de  una  palabra 
de  64  bits,  a cada  casilla  un  bit.  Asi  puede  representarse  el  tablero  con 
doce  palabras.  Con  una  palabra  pueden  representara  los  peones  blancos; 
basta  poner  los  bits  a 1 ó 0,  según  haya  o no  peón  en  La  casilla  correspon* 
diente.  Los  caballos  negTos  se  representan  con  otra  palabra,  y asi  sucesiva- 

Además  de  Las  piezas  en  sí,  este  método  permite  representar  otro  tipo 
de  información  Puede  tenerse  una  palabra  que  represente  todas  as  casi- 
llas en  las  que  hay  piezas  blancas,  otras  para  las  negras,  otra  para  las  casi* 
Lias  macadas  por  piezas  blancas,  etc.  El  programador  iniciará  todas  las  re- 
laciones que  crea  convenientes. 

Con  esta  representación,  el  computador  puede  realizar  fácilmente  opera- 
ciones boo Icarias  con  Y y O lógicos  que  son  útiles  para  obtener  los  resul- 
tados deseados.  , ...  . j ^ 

Supóngase  que  se  estudian,  por  ejemplo,  los  movimientos  validos  des- 
de una  posición  determinada  de  un  alfil  blanco.  Los  movimientos  de  un 
alfil  desde  cada  una  de  las  64  casillas  están  representados  en  ó4  palabras 
de  memoria.  Habrá  que  buscar  en  memoria  la  palabra  que  corresponde  a 
la  posición  en  que  se  encuentra  el  alfil,  para  asi  tener  los  posibles  movi- 
mientos. Seguidamente,  habrá  que  obtener  la  palabra  que  representa  las 
casillas  ocupadas  por  piezas  blancas.  Podrá  moverse  el  alfil  a las  Pacio- 
nes en  que  no  haya  pieza  blanca  y sea  posible  el  movimiento.  Para  ello  ha- 
brá que  negar  (cambiar  unos  por  ceros  y ceros  pur  unos)  la  palabra  que 
indica  las  posiciones  de  tas  blancas  y aplicar  el  Y lógico  con  la  palabra  que 
tiene  los  movimientos  posibles. 

A La  hora  de  considerar  los  posibles  movimientos  realizados,  por  ejem- 
plo los  de  una  pieza  blanca,  habrá  que  estudiar  las  réplicas  de  las  negras, 
asi  como  las  contrarréplicas  de  las  blancas,  y asi  sucesivamente,  hasta  que 
se  determine  una  posición.  Para  poder  examinar  toda  la  informac ton  dis- 
ponible en  el  mblero  se  crea  una  función  de  evaluación.  Esta  estudiara  la 
conveniencia  de  una  posición  en  un  momento  determinado. 

La  función  de  evaluación  va  a sopesar  una  serie  de  factores  que,  de 
pendiendo  de  su  importancia,  influirán  en  mayor  o menor  grado  en  la  de 
terminación  del  movimiento. 

Estos  factores  pueden  ser  entre  otros:  las  piezas  en  el  tablero,  la  cku  iu 
tura  de  tos  peones,  el  control  del  centro  del  tablero,  el  ataque  a puaictimr* 


adyacen  les  al  rey  contrario,  d cierre  de  piezas,  la  posibilidad  de  intercam- 
bio de  piezas,  la  seguridad  del  rey  propio,  etc.  Cada  ve?,  que  se  evalúa  una 
posición  habrá  que  calculare!  valor  de  esta  función.  Eso  es  muy  Frecuente 
en  un  programa  de  ajedrez,  por  lo  que  la  función  de  evaluación  debe  im- 
plementarsc  con  instrucciones  sencillas  y no  es  conveniente  incluir  térmi- 
nos para  lodos  los  factores. 

Una  buena  función  de  evaluación  es  aquélla  que  considera  los  aspec- 
tos críticos  de  la  posición  y los  traía  de  una  forma  adecuada.  Al  incluí j un 
ínctor  en  la  hmeión  de  evaluación  habrá  que  considerar  si  la  eficacia  intro- 
ducida por  dicho  factor  compensa  el  aumento  producido  en  el  tiempo  de 
ejecución.  La  función  de  evaluación  depende  del  método  utilizado  para  de 
terminar  el  movimiento. 

Es  difícil  determinar  cuando  un  nodo  puede  considerarse  como  termi- 
nal y,  por  lanío,  susceptible  de  aplicar  sobre  él  la  función  de  evaluación. 

n general,  se  considera  que  un  nodo  es  terminal  cuando  a partir  de  él  no 
existen  más  capturas. 

Para  determinar  Ea  siguiente  posición  habrá  que  generar  todos  los  mo- 
vimientos posibles,  todas  sus  réplicas  y contrarréplicas  hasta  llegar  a una 
posición  del  tablero  que  considere  el  movimiento  como  idóneo 

No  es  posible  realizar  una  búsqueda  completa  en  profundidad  porque 
se  tiene  un  elevado  número  de  combinaciones  (del  orden  de  I0tw);  por 
tamo,  habrá  que  fijar  un  nivel  máximo  de  profundidad. 

Gira  forma  de  solucionar  este  problema  es  examinar  sólo  un  subcon- 
junto  de  lo  movimientos  posibles  en  cada  nodo.  Se  utiliza  d método  Neu- 
mann  y Morgenstcm,  conocido  como  Mínima*.  Si  quiere  reducirse  aún 
más  el  árbol  de  búsqueda,  « emplea  el  método  de  poda  alfa-beta 

Los  programas  de  ajedrez  aciuales  dan  gran  importancia  a 1*  determi- 
nación de  I primer  movimiento  que  va  a estudiarse  en  cada  nodo  del  árbol. 
Para  dio,  se  utilizan  métodos  heurísticos  que  proporcionan  información 
sobre  d upo  de  movimientos  que  se  le  aplican  en  una  situación  particular 
acelerando  Ea  poda.  Se  toma  el  criterio  de  elegir  los  movimientos  en  que 
se  realice  la  captura  de  una  pieza.  Esto  provoca  un  aumento  en  la  poda, 
ya  que  se  reduce  el  número  de  piezas  y,  por  tanto.  el  número  de  réplicas 
dei  contrario. 

Otra  heurística  consistiría  en  contestar  aun  movimiento  con  otro  ya  es- 
tudiado en  otra  parte  del  árbol,  pues  a lo  largo  de  Ja  partida  se  repiten  mu- 
chos movimientos.  En  este  caso,  se  utilizan  analogías.  La  estrategia  con- 
siste en  examinar  con  detalle  las  réplicas  y determinar  qué  factores  son  ne- 
cesarios para  que  estas  réplicas  sigan  siendo  válidas, 

Todos  los  métodos  vistos  hasta  ahora  no  son  eficientes  a la  hora  de  se- 
leccionar el  tipo  de  salida.  La  efectividad  de  una  salida  no  puede  compro- 
barse hasta  que  la  partida  esté  muy  avanzada  Debido  a que  el  número  de 
réplicas  y contrarréplicas  que  se  estudian  para  cada  movimiento  tienen 
una  profundidad  determinada,  a ese  nivel  todavía  no  puede  comprobarse 
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la  bondad  de  una  salida,  por  lo  que  se  utilizan  librerías  de  salidas  ya  alma 
t e nadas  en  el  computador. 

De  igual  Forma,  el  Rn  de  juego  es  un  caso  especial  y requiere  informa- 
ron adicional.  La  estrategia  ganadora  conlleva  una  secuencia  de  veinte  o 
movimientos.  Una  búsqueda  completa  para  esta  profu n idad  es  total- 
mente imposible.  Por  este  motivo  debe  abandonarse  el  procedimiento  Mí- 
nima* con  poda  alfa-beta  al  final  del  juegu  y adoptar  una  estrategia  alter- 
na uva.  Ira  solución  es  disponer  de  una  librería  de  instrucciones  para  los 
finales  de  juego, 

ANIMALES 

En  este  juego  aparecen  dos  protagonistas,  el  jugador  (usuario)  y el  com- 
puiador.  La  mecánica  del  juego  consiste  en  pensar  un  animal  y el  compu- 
tador ira  realizando  una  serie  de  preguntas  relevantes  que  le  permitan  des 
cubrir  de  qué  animal  se  traía  El  jugador  deberá  responder  a eslas  pregun- 
tas mediante  una  afirmación  (SI)  o (NOJ. 

El  desarrollo  del  juego  requiere  la  existencia  de  una  Base  de  Datos.  En 
ella  estarán  contenidas  todas  las  preguntas  que  pueden  hacerse  al  usuario, 
asi  como  una  serie  de  animales  que  serán  las  posibles  respuestas. 

La  Base  de  Datos  estará  organizada  de  tal  forma  que  dependiendo  que 
la  respuesta  aun  pregunta  sea  afirmativa  o negativa  se  bifurcará  a una  zona 
determinada  de  la  Base.  Las  preguntas  contenidas  en  esto  zona  estarán  en 
relación  con  la  respuesta  a la  pregunta  anterior.  En  este  juego  pueden  in- 
troducirse técnicas  de  aprendizaje.  Entre  las  distintas  técnicas  de  aprendi- 
zaje disponibles  en  IA  puede  utilizarse  la  más  sencilla,  el  aprendizaje  por 
instrucción.  Este  tipo  de  apreadizaje  se  caracteriza  por  que  el  conocimiento 
se  adquiere  a través  de  un  profesor  u otras  fuentes  como  pueden  ser  los 

libros  de  texto,  , 

Aplicado  a este  caso,  el  aprendizaje  se  realizara  cuando  el  computador 
no  tenga  en  su  Base  de  Datos  el  animal  que  el  jugador  ha  pensado,  El  pro 
grama  le  preguntara  al  jugador  de  qué  animal  se  trata,  introduciéndolo 
posterior  mente  en  su  Base  de  Datos,  También  pedirá  al  jugador  que  enun- 
cié  la  pregunta  que  debería  hacerse  para  definir  las  características  que  di- 
ferencian a este  animal. 

Seguidamente  se  proponen  una  Base  de  Datos  que  puede  ampliar  el  lee- 
ior  y un  programa  que  realiza  las  preguntas. 

Un  base  de  animales  sencilla  puede  estar  organizada  de  la  siguiente 
forma: 


( í ES  VERTE&ftADQ 

{(VUELA) 

( GUSANO  I 


í 
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' 1 T WMffill  AGUA  > 

< t TIENE  BRANQUIAS  QUE  SE  TRANSFORMAN  EN  PULMON  ) 
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< SERPIENTE J 
( COCODRILO  ) J 


LECHE ) 
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La  base  tiene  una  estructura  en  forma  de  Hita  y dependiendo  de  que  la 
respuesta  a la  pregunta  sea  afirmativa  o negativa  pasará  a estudiarse  el 
CADR  o d CDDR,  respectivamente,  de  la  lista  para  hacer  una  nueva  pre- 
gunta, Como  puede  verse  en  la  función: 


Se  sugiere  al  lector  que  mejore  la  función  anterior  introduciendo  el 
aprendizaje. 


CUATRO  EN  RAYA 

Las  cuatro  en  raya  se  juega  sobre  un  tablero  de  siete  por  siete,  donde  se 
colocan  las  fichas  de  dos  colores,  correspondientes  a cada  jugador.  Las  fi- 
chas  se  dejan  caer  por  cada  columna  de  forma  alternativa.  El  objetivo  es 
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conseguir  alinear  cuatro  fichas  dd  mismo  color,  ya  sea  vertical,  horizon- 
tal o diagonal 

En  un  juego  de  estrategia  como  éste,  siempre  se  trata  de  saber  si  se  dis- 
pone de  ventaja  sobre  el  cerní  lineante  y cómo  se  puede  mejorar  ésta.  El  pro- 
grama debe  poder  evaluar  las  consecuencias  de  un  posible  movímiento. 
l.sto,  que  para  una  persona  puede  resultar  complicado,  es  fácil  para  un 
i omputador.  Siempre  y cuando  se  encuentre  una  estructura  adecuada  de 
representación  y un  método  de  evaluación  de  cada  movimiento  lo  más 
acertado  posible 

En  este  juego  se  puede  ver  la  imposibilidad  de  ganar  en  pocas  jugadas; 
ve  debe  tratar  de  ir  formando  alineamientos  de  dos  fichas,  si  es  posible  de 
tri’v.  Cuantas  más  alineaciones  se  tengan,  más  probabilidad  de  ganar.  Es 
evidente  que  los  alineamientos  de  tres  fichas  tienen  más  valor  que  los  de 
dos;  además,  hay  que  impedir  que  el  contrario  efectúe  dichos  alineamien- 
tos, o por  lo  menos  estorbarlos. 

Este  juego  se  presta  a ser  tratado  con  el  procedimiento  Minimax,  es  decir, 
evaluar  una  jugada  y,  a confinación,  todas  las  posibles  respuestas  del  ad- 
versario, y asi  sucesivamente  hasta  encontrar  la  que  mis  posibilidad  de 
éxito  presente.  Para  evaluar  la  eficacia  de  cada  movimiento  se  debe  utili- 
zar una  función  adecuada.  En  ese  caso  se  utilizará  la  siguiente  función: 

W(M)  - 4*  N2  + 9*  S, 

donde  Nj  es  el  número  de  alineamientos  de  dos  Fichas  que  aparecen  al  eje- 
cutar el  movimiento  M y N,  el  número  de  alineamientos  de  tres  fichas.  Es- 
tos dos  valores  están  multiplicados  por  un  factor  que  corresponde  a la  im- 
portancia de  cada  tipo  de  alineamiento.  Además,  si  se  consigue  un  alinea- 
miento de  cuairo  fichas  la  función  W toma  el  valor  máximo  o el  mínimo, 
según  sea  un  alineamiento  del  computador  O del  contrincante. 
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Esta  función  se  utiliza  de  la  siguiente  manera:  en  cada  posición  que  en- 
saya el  ordenador  busca  todas  la  posibles  cadenas  de  longitud  dos  y todas 
las  de  longitud  tres  que  se  realizan  al  colocar  la  ficha.  Si  el  juego  está  en 
la  posición  de  la  figura  15  el  computador  juega  con  los  círculos  y el  con- 
trincante con  cruces,  la  evaluación  correspondiente  a poner  un  círculo  en 
la  columna  cuarta  será: 

W.-4M+9M-IJ 

Si  se  pone  el  circulo  en  la  columna  2,  la  función  de  evaluación  seria: 

Wa  » 4 * 4 + 9 * 0 - 16 

ya  que  en  este  caso  darla  lugar  a cuatro  alineamientos  de  dos  fichas. 

En  principio,  según  la  evaluación,  seria  más  conveniente  realizar  3a  2.* 
jugada.  Pero  la  primera  podría  llevar  a conseguir  un  afincamiento  de  cua- 
tro en  el  siguiente  movimiento.  Para  poder  dirimir  en  este  tipo  de  casos 
es  para  lo  que  se  hace  la  simulación  de  tas  respuestas  del  adversario,  y de 
las  de  la  máquina  al  adversario,  hasta  un  nivel  determinado.  Para  la  eje^ 
cuctón  del  algoritmo  serán  necesarias  unas  variables  S|  que  son  los  tan- 
teos que  potencial  mente  obtiene  cada  nodo  para  el  camino  estudiado. 
y S.  se  inicializan  a - qq,  mientras  que  5>  se  imcUdiza  a + do  cada  vez  que 
se  ha  encontrado  un  nodo  en  el  nivel  correspondiente. 

Como  mejor  se  comprenderá  el  mecanismo  de  la  elección  de  movi- 
miento es  desarrollando  un  ejemplo: 


9^ 


respuesta  que  tiene  la  máquina,  y de  cada  una  de  ellas  salen  las  posibles 
respuestas  del  contrincante.  La  forma  de  recorrer  el  árbol  es  la  siguiente: 


Se  escoge  la  primera  respuesta  y se  analiza: 


De  este  nivel  toma  la  primera  respuesta  del  adversario  y de  aquí,  la  pri- 
mera respuesta  de  la  máquina: 


I 
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Llegado  a este  punto,  el  computador  evalúa  la  función  para  el  movi- 
miento efectuado;  supóngase  que  es  mayor  que  -ooyS,,  (orna  el  valor  4 
A continuación  se  sube  al  nodo  3 y se  explora  el  nodo  S 


si.  por  ejemplo.  Ws  es  11,  este  valor  es  mayor  que  Sj  (-  4);  por  tanto,  él 
nuevo  valor  de  S,  es  U, 

Llegada  a este  punto,  d nodo  3 no  tiene  más  descendientes  y,  por  lan 
to,  se  asciende  al  nodo  superior  para  seguir  analizando  otras  varían  les: 


2 


Antes  de  pasar  al  nodo  ó,  hay  que  comparar  el  valor  de  Sj  con  el  de  Sp.  S, 
tiene  valor  co  por  ser  un  nivel  en  el  que  se  quiere  minimizar  la  función. 
Como  Sr<S,  se  asigna  eí  valor  8 a $,.  Y además  hay  que  hacer  S2  - co,  ya 
que  ahora  se  está  explorando  otra  rama  distinta  que  no  tiene  nada  que  ver 
con  9a  rama  del  nodo  3 y se  asigna  el  valor  mayor  a Sj  (-11), 

Can  este  valor,  se  asciende  al  nodo  2,  de  nuevo,  y se  compara  el  nuevo 
valor  de  Sj  con  el  valor  Sp,  &,<&,;  por  lanío,  no  se  cambia. 
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Cuando  se  ha  terminado  de  explorar  todas  las  ramas  del  nodo  2,  se  lie* 
nr  almacenado  en  St  d valor  mínimo  de  los  tres  valores  de  sus  nodos  des- 
i v n dientes.  A continuación,  se  repite  la  operación  con  el  resto  de  las  ra- 
in ns  que  parten  de  la  rail  y se  obtiene; 


2 13  *3 

De  estas  tres  posibles  jugadas  se  toma  la  de  mayor  valor,  que  en  este 
luso  supondría  ir  al  nodo  23.  Este  es  el  movimiento  que  se  ejecuta. 

Por  supuesto,  el  árbol  se  puede  desarrollar  con  más  profundidad,  con 
lo  que  la  decisión  que  se  tome  será  más  aceptable,  pero  esto  supone  ma- 
yor tiempo  de  operación  y una  mayor  necesidad  de  espacio  en  memoria, 
Para  evitar  en  parte  estos  inconvenientes,  se  puede  utilizar  el  método  de 
poda  alia-beta  introduciendo  pequeñas  variaciones. 

DAMAS 

El  juego  de  las  damas  se  desarrolla  entre  dos  jugadores  sobre  un  table- 
ro de  ajedrez,  también  denominado  * damero™  por  3 a práctica  habitual  de 
este  juego.  Se  utilizan  24  fichas  redondas  y planas  distribuidas  en  número 
igual  entre  los  colores  blanco  y negro,  de  forma  que  se  reparten,  quedan- 
do cada  jugador  en  posesión  de  12  fichas  del  mismo  color. 

Para  comenzar  el  juego,  las  fichas  deben  ser  situadas  sobre  el  tablero 
delante  de  cada  jugador,  ocupando  los  cuadros  negros.  De  cssa  forma  se 
ocupan  tres  Líneas  de  cada  uno  de  los  lados  del  tablero,  quedando  vacías 
tas  dos  lincas  centrales.  Esta  configuración  inicial  es  la  que  se  muestra  en 
la  figura  16. 

La  finalidad  del  juego  es  tomar  las  fichas  de!  jugador  contrarío,  saltando 
por  encima  de  ellas,  siempre  que  se  encuentre  una  casilla  vacía  detrás  de 
la  ficha  que  se  captura.  En  esta  casilla  libre  es  donde  se  situará  la  ficha  del 
jugador  que  mueve,  y la  ficha  capturada  (saltada  por  encima)  se  retira  del 
tablero,  pasando  a poder  del  jugador  que  la  capturó.  La  captura  de  una  fi- 
cha puede  repetirse  dos  o tres  veces  seguidas  en  el  tumo  de  un  jugador 
siempre  que  pueda  saltar  las  fichas  correspondientes  del  adversario  Gana 
la  partida  aquel  jugador  que  primero  consigue  apoderarse  de  todas  tas  fi- 
chas del  opone  nte. 

En  cada  tumo,  un  jugador  puede  mover  cualquiera  de  sus  fichas,  pero 
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sólo  una  de  ellas.  Un  movimiento  consiste  en  desplazar  la  ficha  un  cuadro 
hacia  delante,  pero  en  dirección  diagonal,  es  decir,  a otro  cuadro  negro  ad- 
yacente  situado  hada  delante.  Nunca  puede  moverse  una  ficha  en  linea 
recta  m hacia  atrás,  salvo  en  el  caso  de  que  la  ficha  que  se  mueve  sea  una 


dama,  en  cuyo  caso  puede  mover  hacia  atrás  diagonalmente 

Un  jugador  consigue  una  -dama,  cuando  ha  llegado  con  una  de  sus 
chas  a la  primera  linea  del  campo  adversario,  es  decir,  al  borde  opuesio 
del  tab  em  Fara  reconocer  a una  dama  se  le  coloca  otra  ficha  encima  A 
parnr  de  ese  momento  la  dama  es  la  única  ficha  que  tiene  derecho  a des- 
plazarse a lo  largo  del  tablero,  todas  las  casillas  que  pueda  hasta  llegar  a 
un  borde  o a una  ficha  propia,  tomando  todas  las  fichas  del  bando  contra- 
no  que  encuentre  en  su  camino,  U potencia  de  una  dama  es  superior  a 
Ja  de  una  ficha  normal,  por  lo  que  hay  que  intentar  hacer  dama  lo  más  rá- 
pidamente posible. 

Una  jugada  interésame  es  aquélla  en  la  que  uno  de  los  jugadores  reali- 
za un  movimiento  de  forma  que  deliberadamente  deja  una  de  sus  fichas 
en  peligro,  ya  que  su  adversario  puede  capturaría  en  un  movimiento  Si 
este  omite  comer  la  ficha  en  su  tumo,  se  dice  que  ésta  se  encuentra  en 
«soune*  y se  retira  del  juego  como  si  el  jugador  realmente  la  hubiera  co- 
mido Esta  actitud,  sin  embargo,  no  es  obligatoria  v sólo  se  hace  uso  de 
ella  si  3a  situación  resultante  es  ventajosa. 

Respecto  a la  programación  de  este  juego  existen  diversos  programas 
que  ofrecen  comportamientos  diversos.  El  más  famoso  y cuidado  de  dios 
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i h rl  realizado  por  Arthur  Samuel  en  la  Universidad  de  Illinois,  Comenzó 
mis  primeros  trabajos  en  el  estudio  del  juego  de  las  damas  en  1947,  año  en 
el  que  apareció  b primera  versión  de  su  programa.  Sus  investigaciones 
continuaron  realizando  versiones  mejoradas  del  programa  hasta  la  última, 
que  está  fechada  en  1967. 

El  programa  se  basa  en  un  procedimiento  de  búsqueda  alfa-beta  que  uti- 
liza  purga  convergente  hacia  delante  y exploración  del  árbol  en  amplitud 
para  realizar  la  ordenación  de  los  movimientos  en  orden  decreciente  de 
ptausihilktad,  Las  diferentes  versiones  del  programa  incorporan  diversas 
heurísticas  para  guiar  la  búsqueda. 

La  gran  importancia  de  este  programa  consiste  en  su  utilización  para 
investigar  en  el  intrincado  campo  del  aprendizaje  por  parte  de  los  compü- 
1 adores.  En  términos  generales,  puede  decirse  que  el  programa  incorpora 
una  combinación  de  las  técnicas  denominadas  «aprendizaje  por  generali- 
zación., partiendo  de  ejemplos  para  concluir  reglas  generales  de  opera- 
ción y «aprendizaje  mernorístíeo*.  es  decir,  almacenamiento  ordenado  de 
movimientos  o acciones  que  son  de  importancia  por  su  trascendencia  en 
el  desarrollo  del  juego  o por  su  frecuencia  de  aparición. 

En  lo  que  se  refiere  a aprendizaje  por  generalización,  el  programa  con- 
sigue mejorar  la  función  de  evaluación  estática  del  procedimiento  alfinbc- 
la  Para  ello  utiliza  procedimientos  prácticos  que  llevan  a!  computador  a 
aprender  buenas  funciones  de  evaluación  por  medio  de  análisis  estadísti- 
cos sobre  las  jugadas  que  aparecen  en  los  libros  escritos  por  expelí  os.  El 
irabajo  habitual  mente  debe  realizarse  partiendo  ele  La  información  directa 
obtenida  de  los  expertos  en  la  materia,  pero  si  se  carece  de  la  presencia 
de  un  experto  no  queda  más  remedio  que  utilizar  la  información  que  ofre- 
cen ios  libros  especializados. 

Estos  libros  especializados  suelen  mostrar  una  serie  de  movimientos 
del  juego  en  determinadas  situaciones  que  conducen  siempre,  o casi  siem- 
pre, a la  victoria.  La  función  de  evaluación,  entonces,  ha  de  diseñarse  de 
forma  que  seleccione  los  movimientos  recomendados  por  los  expertas  con 
la  mayor  frecuencia  posible.  En  sus  primeras  investigaciones,  Samuel  res- 
tringió las  funciones  posibles  exclusivamente  a Funciones  lineales.  Poste- 
riores versiones  del  programa  hacen  uso  de  lo  que  denomina  «labia  de  sig- 
naturas;*. en  la  que  se  registran  determinados  parámetros  que  afectan  a 
cada  jugada,  así  como  la  propia  jugada.  Para  trabajar  con  esta  tabla  no  es 
necesario  que  la  función  de  evaluación  sea  lineal,  ya  que  ha  de  tener  en 
cuenta  la  posible  interacción  entre  distintos  factores.  Existe  una  enorme 
dificultad  práctica  en  encontrar  la  función  de  evaluación  óptima,  es  decir, 
la  función  que  elige  siempre  el  movimiento  adecuado  (el  recomendado 
por  los  libros).  Sin  embargo.  Samuel  consiguió  programar  procedimien- 
tos que  construían  funciones  de  evaluación  que  elegían  el  movimiento 
correcto  en  un  3S  por  100  de  las  ocasiones,  aproximadamente  La  última 
versión  del  programa  consigue  porcentajes  aún  mejores. 


lOl 


En  lo  que  se  refiere  al  aprendizaje  por  memorización,  el  programa  per* 
mite  «aprender*  movimientos  recomendados  por  los  libros,  al  igual  que 
posiciones  que  ya  han  sido  evaluadas  por  el  programa  y que  suceden  con 
frecuencia  en  las  partidas  reales.  El  programador  puede  Forzar  al  ordena- 
dor a elegir  en  alguna  situación  concreta  uno  de  los  movim lentos  que  tie- 
ne almacenados  en  la  memoria,  si  existe  alguno  aplicable.  También  puede 
dejarse  ai  programa  elegir  por  sí  mismo  el  momento  adecuado  en  el  que 
debe  realizar  uno  de  los  movimientos  aprendidos.  Cada  vez  que  e]  progra- 
ma es  forzado  a una  jugada  de  Jas  de  su  memoria,  recuerda  que  el  movi- 
miento no  fue  realizado  como  consecuencia  de  la  búsqueda,  sino  extraído 
directamente  de  la  memoria. 

El  mercado  informático  posee  juegos  de  damas  comercializados  de  muy 
diversas  prestaciones;  por  supuesto,  todos  ellos  omiten  toda  la  pane  de 
aprendizaje  que  se  ha  expuesto,  ya  que  sus  Enes  son  meramente  comer- 
ciales y no  de  investigación. 

Variantes  del  juego 

El  juego  de  las  damas  está  ampliamente  extendido  y quizá  por  ello,  exis- 
ten un  gran  número  de  variantes  sobre  el  juego  origina!.  La  mayoría  de  las 
variaciones  son  bastante  poco  interesantes,  tanto  desde  el  punto  de  vista 
computaciúna!  como  desde  d punto  de  vista  lódico,  por  lo  que  no  han  te- 
nido gran  aceptación  por  parte  de  la  comunidad  informática.  Una  de  las 
variantes  más  famosa  e interesante  son  las  damas  trian  guiares,  cuyas  re- 
glas se  explican  a continuación. 

El  juego  de  las  damas  triangulares  utiliza  también  el  tablero  de  ajedrez, 
pero  sólo  son  necesarias  20  Retías,  10  para  cada  uno  de  los  dos  jugadores 
que  intervienen . El  nombre  del  juego  proviene  de  3a  colocación  de  las  fi- 
chas sobre  el  tablero  en  el  comienzo  del  juego,  en  forma  de  triángulo, 
como  muestra  Ja  figura  de  Ja  página  siguiente. 

Las  fichas  se  mueven  de  La  misma  forma  que  en  el  juego  de  las  damas, 
pero  La  ficha  del  contrario  que  es  sallada  no  resulta  afectada  por  ello,  es 
decir,  no  se  atrapan  las  fichas  del  oponente.  La  finalidad  del  juego  es  la  co- 
locación de  todas  las  fichas  de  un  jugador  en  las  posiciones  que  ocupaban 
inicialmente  las  del  oponente,  ganando  el  jugador  que  lo  consiga  en  pri- 
mer lugar. 

En  este  caso  la  estrategia  del  juego  no  consistirá  en  perseguir  implaca- 
blemente las  fichas  del  contrario,  sino  que  debe  buscarse  la  situación  de 
las  Fichas  propias  sobre  el  tablero  de  forma  que  obstaculicen  el  paso  del 
adversario  a la  vez  que  se  van  acercando  a las  posiciones  buscadas. 

Como  puede  observarse,  la  realización  de  un  programa  sobre  este  jue- 
go no  diferiría  demasiado  de  la  formulación  del  programa  de  Jas  damas. 
Básicamente  se  utilizaría  cualquier  implemcntación  del  procedimiento  de 
poda  a lía -beta,  que  resulla  el  más  adecuado  para  esic  tipo  de  juegos. 


EL  DOMINO 

Pese  a que  existen  muchas  variantes  del  juego,  este  capítulo  sólo  se  va 
:i  centrar  en  la  variante  clásica  que  se  practica  entre  dos  parejas  de  juga- 
dores. El  componente  básico  del  dominó  son  las  28  fichas  de  dos  caras 
con  las  que  se  juega.  Una  de  las  caras  es  opaca,  de  forma  que  rto  se  puede 
ver  lo  que  contiene  la  ülra  cara.  Esta  última  es  la  que  posee  La  informa- 
ción de  la  ficha,  y está  separada  por  la  mitad  por  una  linea  divisoria.  Cada 
una  de  estas  partes  puede  estar  en  blanco  o poseer  un  número  de  puntos 
contenido  entre  uno  y seis.  Estos  pumos  negros  vienen  expresados  de  la 
m guíente  forma: 


Por  Lanto.  una  ficha  como  el  blanco-cuatro  vendrá  expresada  de  la  si- 
guiente forma: 
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Las  reglas  del  juego  son  las  siguientes: 

l Se  colocan  las  28  debas  con  la  cara  opaca  hacia  arriba,  de  forma 
que  no  se  puedan  ver  los  números  de  cada  ficha.  A continuación,  se  re- 
vuelven al  azar,  para  que  no  se  pueda  identificar  a ninguna  ficha,  y se  re- 
parten 7 fichas  a cada  jugador.  Estos  pondrán  las  fichas  de  tal  manera  que 
puedan  ver  sus  propias  fichas,  pero  no  las  de  los  demás  jugadores, 

2.  Cada  partida  se  divide  en  juegos.  En  el  primer  juego  de  cada  parti- 
da, colocará  la  primera  ficha  aquel  jugador  que  posea  el  seis  doble  entre 
sus  fichas;  es  decir.  Ja  ficha  que  contiene  un  seis  en  cada  una  de  las  partes 
en  las  que  se  divide  la  cara  no  opaca  Para  colocar  la  fiefia,  la  pondrá  con 
la  cara  no  opaca  boca  arriba  en  el  centro  de  la  mesa  de  juego.  En  los  de- 
más juegos,  se  saldrá  por  tumo  en  el  sentido  contrario  a las  agujas  del  re- 
loj. Al  jugador  que  sale  en  cada  juego  se  le  denomina  mano, 

3.  El  juego  se  practica  por  tumo,  en  el  sentido  contrario  a las  agujas 
del  reloj.  En  el  tumo  de  cada  jugador,  éste  podrá  poner  alguna  ficha  si  al- 
guno de  los  números  de  los.  dos  extremos  libres  de  las  fichas  puestas  en  el 
tablero  coincide  con  algún  número  de  alguna  de  las  fichas  que  posee.  En 
este  taso,  pondrá  la  ficha,  de  forma  que  los  dos  números  iguales  queden 
adosados.  Si  la  ficha  que  ha  de  poner  es  un  doble,  se  colocará,  por  conve- 
nio, trans  versal  mente  a la  ficha  anterior. 

En  la  figura  de  la  página  siguiente  se  puede  observar  la  situación  de 
una  partida  al  final  de  la  misma.  Puede  comprobarse  que  el  seis  doble  no 
se  ha  puesto,  por  lo  que  se  deduce  que  no  es  el  primer  juego  de  una  par- 
tida, Si  algún  jugador  no  puede  poner  ninguna  de  sus  fichas,  se  dice  que 
pasa,  y le  tocará  jugar  al  siguiente  a él. 

4.  El  juego  puede  terminar  de  dos  formas: 

aj  Todos  los  jugadores  pasan,  con  lo  cual  se  dice  que  la  partida  se  ha 
cerrado.  Ganará  la  pareja  que  menos  puntos  posea  entre  sus  fichas. 

b)  Algún  jugador  termina  de  poner  todas  sus  fichas,  con  lo  cual  gana- 
rá la  pareja  formada  por  él  y su  compañero. 

Normalmente,  se  establece  un  convenio  de  puntuación-  Así  en  cada  jue- 
go se  van  acumulando  puntos  hasta  que  se  llegue  a un  tope  acordado. 
Cuando  esto  se  produzca,  se  finalizará  la  partida 

Debido  a que,  al  principio  de  cada  juego,  se  reciben  las  fichas  al  azar, 
se  puede  pensar  que  este  juego  es  de  azar.  Esto  no  se  corresponde  total- 
mente con  la  realidad,  puesto  que  se  ha  de  saber  jugar  y utilizar  las  técni- 
cas que  existen.  Las  reglas  empíricas  primordiales  sobre  las  que  actúan 
casi  todos  los  buenos  jugadores  son  dos: 

— jugar  can  el  compañero; 

— recordar  quién  ha  puesto  cada  una  de  las  fichas  y en  qué  momento. 

La  primera  regla  se  comprende  fácilmente,  pues  el  objetivo  es  derrotar 

a una  pareja  y para  ello  es  necesaria  la  colaboración  de  los  dos  miembros 
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dd  equipo.  En  principio,  se  ha  de  ayudar  siempre  al  compañero  que  sea 
d mano  o,  en  su  defecto,  que  esté  a la  derecha  del  mano.  Se  entiende  por 
ayudar  el  colocar  fichas  en  cuyo  extremo  libre  queden  números  sobre  tos 
que  el  compañero  haya  demostrado  estar  fuerte.  Sin  embargo,  existen  si 
tuaciones  en  las  que  se  intercambian  los  papeles  de  mano  dentro  de  a pa- 
reja, Esto  sucede,  por  ejemplo,  cuando  d que  actúa  como  mano  en  la  pa- 
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reja  tiene  que  pasar  en  un  momento  dado.  En  esc  instante  el  compañera 
se  convierte  en  mano  de  k pareja  y el  que  ha  pasado  ha  de  ayudarle. 

La  segunda  regla  es  elemental,  pues  si  se  conoce  información  de  tal 
tipo,  se  restringe  e|  número  de  fichas  que  pueden  colocarse.  Si,  por  ejein- 
pío,  se  observa  que  el  jugador  que  está  a la  derecha  ha  pasado,  teniendo 
en  los  extremos  libres  del  tablero  un  cuatro  y un  cinco,  significa  que  no 
tiene  ni  cuatros  ni  cincos,  Esto  implica  que,  siempre  dentro  de  lo  posible 
y contando  con  el  juego  de  pareja,  se  internan*  dejar  en  los  extremos  o un 
cuatro  o un  cinco,  a fin  de  que  le  sea  difícil  poner  sus  fichas.  V al  contra- 
rio, también.  Si  se  comprueba  que  pone  muchos  doses,  se  ha  de  intentar 
no  dejar  doses  en  los  extremos,  puesto  que  se  le  estaría  facilitando  el  juego. 

Estas  dos  reglas  y otras  más  forman  parte  del  conocimiento  heurístico 
o,  a pnori.  del  problema.  El  conocimiento  heurístico  hace  que  a la  hora  de 
explorar  vanas  posibilidades  en  un  árbol  de  búsqueda  o aplicar  un  con- 
junio  de  reglas,  se  restrinja  el  trabajo  que  ha  de  realizarse.  Consiguiente- 
mente, se  reduce  de  una  manera  considerable  ej  tiempo  de  ejecución.  Esta 
es  h idea  primordial,  como  ya  se  ha  visto,  del  conocimiento  de  este  tipo. 

Como  una  primera  aproximación  al  tema,  podría  pensarse  que  el  pro- 
cesamiento alfa-beta  resolvería  pane  del  problema  (Cap.  1),  Pero  esto  re- 
presenta sólo  un  acercamiento  a la  forma  de  resolverlo. 

Al  igual  que  en  muchas  áreas  de  la  vida  española,  el  refranero  se  ha 
ido  nutriendo  cotí  refranes  referentes  al  juego  del  dominó.  Representan  co- 
nocimiento empírico  que  sirve  de  ayuda,  en  ocasiones,  para  la  toma  de  de- 
cisiones. A su  vez  este  Conocimiento  empírico  es  lo  que  en  I A se  denomi- 
na heurística.  Todo  esto  hace  pensar  que  ya  que  se  pueden  obtener  reglas 
de  actuación  al  mismo  tiempo  que  heurísticas,  se  puede  impíemcntar  el 
dominó  con  estructura  de  Sistema  de  Producción, 

EJ  diseño  que  aquí  se  expone  es  teórico,  pero  está  siendo  llevado  a la 
práctica  con  resultados  positivos.  Las  tres  partes  en  que  se  dividirá  el  Sis- 
tema de  Producción  serán; 

a)  Base  de  Hechos  En  ella  se  almacenará  la  información  concernien- 
te al  desarrollo  del  juego.  Se  deberán  guardar,  por  ejemplo,  datos  referen- 
tes a: 

— las  fichas  puestas  por  cada  Jugador; 

— las  fichas  de  la  máquina; 

— situación  del  tablera; 

— con  qué  números  ha  pasado  cada  jugador,  etc. 

En  este  caso,  d estado  inicial  es  eí  principio  de  la  partida,  EJ  estado  fi- 
nal no  está  definido  en  Ja  Base  de  Hechos,  v aparecerá  en  la  Base  de  Re- 
glas. Sin  embargo,  se  sabe  hacia  qué  estado  se  tiende;  lograr  colocar  todas 
las  fichas  o ayudarle  al  compañero  a que  lo  haga.  Como  una  segunda  meta 
puede  considerarse  el  cerrar  cuando  se  crea  que  se  tienen  menos  puntos 
entre  k máquina  y su  compañero,  que  los  contrarios. 


tOó 


b)  Base  de  Reglas.  Contendrá  todas  las  reglas  que  dirigirán  el  juego. 

Al  mismo  tiempo,  delimitarán  qué  fichas  se  pueden  poner  en  un  instante 
Lk  terminado.  Se  dispone  también  de  melarregias,  que  son  los  refranes, 
t omo  va  se  ha  explicado,  las  melarreglas  reducen  el  conjunto  de  reglas 
que  han  de  aplicarse,  en  base  a determinadas  informaciones  sobre  el 

" c)  "fktrategta  de  Control.  Los  dos  puntos  claves  de  la  Estrategia  de 
Control  para  este  problema  van  a ser 

- Los  refranes,  en  forma  de  metarregks,  van  a dirigir  el  proceso,  pro- 

porcionando información  empírica.  Esto  ayudará  en  la  etapa  de  restric- 
ción en  la  fase  de  Decisión,  , 

- La  resolución  del  conjunto  conflicto  se  puede  realizar  mediante  el 
procedimiento  alfa-beta.  Para  cuando  vaya  a aplicarse  dicho  procedimien- 
to va  se  tendrá  muy  limitada  k elección  de  k ficha  que  se  pondrá.  Ello 
ayudará  al  procedimiento  y,  por  tanto,  al  programa,  pues  hace  que  el  nu- 
mera de  ramas  de  búsqueda  sea  muy  inferior  al  que  *e  tendría  si  fuese  este 
procedimiento  el  programa  principal.  U función  de  evaluación  que  se 
puede  utilizar  deberá  depender  de  probabilidades  que  se  basarán  en  la  in- 
formación contenida  en  la  Base  de  Hechos- 

Las  principales  ventajas  de  esta  solución  sobre  la  utilización  de  un  pro- 
grama convencional  son; 

- flexibilidad.  Este  sistema  trata  cada  partida  de  forma  diferente,  al 
mismo  tiempo  que  se  adapta  al  transcurso  de  la  partida.  Eñ  cada  juego  _se 
disparan  diferentes  reglas,  dependiendo  de  k situación  de  la  partida. 

_ aprendizaje.  Se  Le  puede  añadir  un  proceso  de  aprendizaje.  Esto  re- 
sulta fácil  de  implemcntar.  ya  que  se  puede  guardar  una  historia  del  pro- 
ceso del  juego.  Esto  quiere  decir  que  se  puede  almacenar,  por  ejemplo,  el 
orden  de  las  reglas  aplicadas  en  cada  partida  Al  mismo  tiempo,  se  pueden 
salvar  los  diferentes  estados  de  la  Base  de  Hechos.  Si  jugando  una  partida 
se  encuentra  una  situación  similar  a uno  almacenada,  evitara  mucho  tra- 
bajo a la  Estrategia  de  Control,  tanto  en  k elección  de  las  reglas  como  en 
resolución  del  conjunto  confiicio.  En  este  caso  se  estarán  utilizando  las  ana 
logias  que  existen  entre  las  partidas  Uniendo  el  proceso  de  aprendizaje  ai 
de  utilización  de  las  analogías,  se  está  llegando  cerca  de  la  forma  de  ac- 
tuación humana  en  determinados  momentos.  Ello  quiere  decir,  que  con  arre- 
glo a la  realización  de  muchas  partidas,  la  máquina  se  irá  conviniendo  en 
un  experto. 

31  ELISA 

Se  trata  de  simular  una  conversación  entre  un  psiquiatra  (la  máquina) 
y un  supuesto  paciente  (el  jugador).  Esta  conversación  se  llevara  a cabo 
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en  base  a múdelos  de  frases  preestablecidos.  El  programa  debe  encontrar 
la  semejanza  entre  las  frases  modelos  y la  frase  que  el  paciente  ha  intro- 
uncido  por  el  terminal. 

El  problema  que  hay  que  resolver  es  determinar  las  semejanzas  entre 
e patrón  y la  frase  en  estudio.  Habrá  que  comparar  expresiones  para  ver 
si  son  similares.  Aunque  el  lenguaje  LJSP  no  tenga  preestablecidos  patro 
nes,  pueden  implcmemarse  fácilmente.  Se  consideraran  el  patrón  v toda 
¿tomos  * * ™*  qUC  **  compara  como  listasí  seran,  pues,  una  lista  etc 

Un  patrón  puede  contener  símbolos  especiales  que  no  están  permití 
os  en  las  frases.  Cuando  se  compara  un  patrón,  que  no  contiene  ninguno 
de  estos  símbolos  especiales,  con  una  frase,  coincidirán  sólo  si  son  exac- 
tamente iguales,  es  decir,  los  átomos  (palabras)  en  las  mismas  posiciones 
deben  ser  iguales.  Se  puede  utilizar  d símbolo  especial  ? como  comodín 
para  casar  cualquier  átomo  y el  símbolo  + para  casar  uno  o más  átomos. 

Por  ejemplo,  los  patrones  siguientes  casan  con  las  frases  a su  derecha; 

( COLOR  > ROJO  ) ( COLOR  MANZANA  ROJO) 

{ ESTO  + LISTA  } { ESTO  ES  UNA  LISTA) 

Para  comparar  dos  expresiones  habrá  que  hacerlo  átomo  a átomo;  para 
ello  se  define  Ja  función  COMPARAR.  Esta  función  tendrá  una  estructura 
recu rs t va;  comparará  el  primer  elemento  de  las  dos  listas  y,  en  caso  de  ser 
i guates,  se  llama  recursivamente  para  comparar  el  resto  de  los  elementos 

7¡*  Primera  cláusula  de  la  condición, comprueba  si  se  ha  llegado  al 
hnal  de  la  lista  y,  por  tanto,  se  termina  la  recursión  v Ja  segunda  comprue- 
ba si  una  lista  es  más  larga  que  la  otra,  Habrá  que  considerar  también  los 
comodines  + y?  En  la  cláusula  de  la  condición  en  que  se  comprueba  si  apa- 
rece ci  comodín  + habni  que  hacer  llamadas  recursivas  a COMPARAR  para 
ver  si  se  da  uno  de  ios  casos;  hay  que  casar  a + con  un  átomo  o hav  que 
hacerlo  con  dos  o más  átomos,  en  cuyo  caso  se  seguirán  haciendo  llama- 
das recursivas. 


fcoVír 


í BE  FjJ ^COMPARA R ( PATRON  FRASE  ) 

* NULL  frase  ) ) t } 

pí itllwMYtt3*»  NIL> 

f J ( c A ft  FRASE  ) } ) 

‘ CDR  '"™SE  > 1 > 

! oh  í wjKvsrifitews  ,m > 


Este  programa  puede  mejorarse  introduciendo  variables  de  patrón  que 
van  precedidas,  por  > o +,  que  realizan  una  función  semejante  a los  co- 
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modines  ?y  + vistos  anteriormente.  Cuando  una  variable  de  patrón  va  pre- 
cedida por  > al  compararse  le  asocia  a la  variable  el  átomo  situado  en  esa 
posición-  Si  va  precedido  por  +,  asocia  uno  o más  átomos. 

Por  ejemplo, 

{EXP  ( < A)  ( > B))  - (EXP  2 3) 

{(A  2)  (B  3)} 

(í+  L)  MAMA  (+  Rj)  -*  (DESDE  QUE  MAMA  HABLO) 

((L  (DESDE  QUE))  (R  (HABLO))) 

Como  puede  verse,  las  variables  por  > se  asocian  a átomos  y las  pre- 
cedidas por  +■  se  asocian  a listas. 

Se  introduce  un  tercer  argumento  en  la  función  COMPARAR,  que  va  a 
devolver  una  lista  con  la  variable  de  patrón  y sus  valores  asociados. 

Para  genera  (izar  la  función  COMPARAR  se  utilizan  dos  funciones  en  la 
cláusula  del  COND,  denominadas  INDICADOR-PATRON  y VARIABLE- 
PATRON. 

Si  el  indicador  de  patrón  es  >,  devolverá  como  argumento  una  lista  fot 
mada  por  el  par  formado  por  la  variable  de  patrón  y su  valor  asociado.  Si 
el  indicador  de  patrón  es  +,  devolvería  en  dicha  lista  la  variable  de  patrón 
y la  lista  de  elementos.  Para  realizar  esto,  se  usan  ASOCIAR- ATOMO  y 
ASOCIAR-LISTA. 

Se  pasa  a exponer  dichas  funciones: 


( DEFÜN  INDICADOR-PATRON  { LISTA  ) 
í CAR  LISTA  } ) 

( DEFÜN  VARIABLE-PATRON  ( USTA  ) 

[ CADR  LISTA  } ) 

i DEFÜN  ASOCIAR- ATOMO  í VARIABLE  ELEMENTO  LISTA  > 

( AFPEND  LISTA  { LIST  t LIST  VARIABLE  ELEMENTO  ) > )) 

( DEFÜN  ASOCIA  R- LISTA  ( VARIABLE  ELEMENTO  LISTA  ) 

(COND  (ÍNULL  LISTAX  LIST  ( LIST  VARIABLE  (LIST  ELEMENTO»)) 
j ( EOUAL  VARIABLE  ( CAAR  LISTA  ) } 

CÍl1ST  VARIABLE  (A P PENO  (CADAR  LISTA)  (LIST  ELEMENTO») 

( CDR  LISTA) ) } 

(T  ( CON^|^cI¡AL¿^sjA  VARIABLE  ELEMENTO  (CDR  LÍSTA)»)) 


A veces  hay  que  tener  en  cuenta  que  dentro  de  un  patrón  dos  variables 
han  de  tomar  el  mismo  valor.  Por  ejemplo: 

ESA  CASA  ES  GRANDE.  ME  GUSTA  ESA  CASA, 

ESA  A ES  GRANDE.  ME  GUSTA  ESA  A 
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Esto  se  indita  con  la  variable  precedida  por  < Para  ello  se  utiliza  la  fun- 
ción SACAR. 


{ DSFUN  SACAR  í VARIABLE  LIST  A > 

< CADR  ( ASSOC  VARIABLE  LISTA  ) ) ) 


La  función  COMPARAR  quedaría  como  sigue: 


iCTON)  ) 

|AMOM»'> 
►ATROFÍ  rCAR  PÁTHOWiJ 


1 ‘(cSSÍÍIa» í™írC' cII’patíon  n • O 

ÍCONB 

Í5ACAM  IV^UAQ^^ATROH  (CAS  PATUCA)  ASfCWACIONJ 


psí^AwoK  <=«>«»»» 

AR^O^STAOfÍ]  ÍCDR  FRAS1Ó  ASJGNUÜVAí 
PATRON  (Coa  FRASE)  ASlCNUEVA)  J ) ))) 


En  base  a lo  anterior,  puede  escribirse  una  función  que  si mulé  una  con- 
versación coloquial  como  puede  ser: 


(DOCTOR] 

(HABLE) 

(ESTOY  PREOCUPADO  POR  MI  SALUD) 

(CUANTO  TIEMPO  HACE  QUE  ESTA  PREOCUPADO) 
(DESDE  QUE  Mi  MADRE  HABLO) 

(HABLEME  DE  SU  FAMILIA) 

(ACTUALMENTE  TODOS  TRABAJAN  CON  ORDENADORES) 


l JO 


(TIENE  MIEDO  A LAS  MÁQUINAS) 

(NO) 

(NO  ME  OCULTE  NADA,  POR  FAVOR) 

(VAYASE  AL  INFIERNO) 

(POR  FAVOR,  NO  UTILICE  ESE  VOCABULARIO) 
(ME  ESTA  FRUSTRANDO) 

(HABLE  DE  SU  MADRE) 

(AHORA  NO  DIGAME  CUAL  ES  MI  PROBLEMA) 
(LO  SIENTO  LA  SESION  HA  FINALIZADO) 
ADIOS 


La  función  DOCTOR  sera  un  bucle  controlado  por  un  COND  que  rea- 
lista la  comprobación  de  palabras  en  las  frases  dando  Us  respuestas  que  se 
sugieren  en  el  diálogo  anterior.  Se  sugiere  al  lector  que  realice  dicho 
programa. 


KALAH 


El  kalah  es  un  juego  de  dos  contrincantes,  probablemente  de  ori- 
gen asiático.  Los  materiales  necesarios  para  la  realización  del  juego  son 
muy  sencillos.  No  es  necesario  disponer  de  un  tablero  especial  es  sufi- 
ciente con  un  espacio  en  el  que  puedan  disponerse  14  orificios  o 14  reci- 
pientes (según  sea  el  material  sobre  el  que  sé  va  a jugar),  y 72  pequeñas 
piedras  o cualquier  tipo  de  cuenta  de  reducido  tamaño.  La  disposición  de 
los  orificios  debe  ser  la  que  muestra  la  figura  17, 

Cada  uno  de  los  jugadores  es  dueño  de  7 de  los  orificios.  De  ellos, 
ó se  encuentran  alineados  y el  otro  es  el  denominado  kalah,  que  tiene  un 
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papel  importante  en  el  juego.  La  disposición  del  kalah  de  cada  jugador 
debe  ser  fija  respecto  a la  situación  de  los  orificios,  tal  como  muestra  la 
figura  17.  En  el  caso  de  la  figura,  el  jugador  1 seria  dueño  de  los  ori- 
ficios etiquetados  en  mayúsculas,  mientras  que  el  jugador  2 poseería  los 
etiquetados  en  letras  minúsculas. 

Las  72  piedras  o cuentas  se  reparten  equitativamente  aJ  inicio  del  jue- 
go y cada  jugador  debe  colocar  las  36  que  le  corresponden  distribuidas  de 
6 en  ó en  cada  uno  de  sus  orificios,  quedando  el  kalah  vacío.  Así,  al  co- 
mienzo del  juego  la  situación  del  tablero  debe  mostrar  6 piedras  en  cada 
uno  de  los  orificios  A.  B,  C,  D,  E,  F,  a,  b,  c,  d,  c y F.  mientras  que  los  kalah 
kt  y k2  no  deben  contener  piedra  alguna. 

El  objetivo  de!  juego  es  conseguir  introducir  el  mayor  número  posible 
de  piedras  en  el  kalah,  de  Forma  que  gana  la  partida  el  jugador  que  consi- 
gue tener  en  su  kalah  más  de  la  mitad  de  Jas  piedras  que  intervienen  en 
el  juego,  es  decir,  más  de  36  piedras.  Cuando  tal  cosa  ocurre,  el  juego  ter- 
mina, pero  también  puede  darse  por  terminado  el  juego  cuando  lodos  Jos 
orificios  de  uno  de  los  jugadores,  excluido  el  kalah,  queden  vacíos  (inclu- 
so si  este  hecho  se  produce  cuando  no  es  su  tumo).  Si  esto  sucede,  las  pie- 
dras que  quedan  en  los  orificios  del  contrario  se  colocan  en  su  propio  kalah  y 
termina  el  juego,  procediéndose  al  recuento  de  las  piedras  para  saber  cuál 
de  los  dos  es  e|  ganador. 

La  Forma  de  realizar  un  movimiento  en  el  juego  del  kalah  consiste  en 
tomar  un  número  cualquiera  de  piedras  de  uno  de  los  orificios  propios.  A 
continuación,  se  van  colocando  las  piedras  una  por  una  en  sus  propios  ori- 
ficios y en  los  del  contrario,  recorriendo  el  tablero  de  juego  en  sentido  con’ 
trario  a las  agujas  del  reloj.  Por  supuesto,  entre  los  orificios  propios  se 
cuerna  el  kalah.  El  jugador  debe  colocar  exactamente  una  piedra  en  cada 
orificio,  ya  sea  suyo  o del  contrario,  quedando  excluido  el  kalah  de  su  opo- 
nente, en  el  que  no  dejara  ninguna  de  las  piedras  que  haya  tomado. 

El  siguiente  movimiento  que  ha  de  realizarse  tras  el  de  un  jugador  está 
determinado  por  el  lugar  en  el  que  este  ultimo  depositó  3a  última  piedra 
que  había  tomado.  Las  situaciones  posibles  son  tres: 

— Si  el  jugador  coloca  la  última  piedra  en  su  propio  kalah.  su  tumo 
se  mantiene,  es  decir,  puede  mover  de  nuevo, 

— Si  el  jugador  coloca  Ja  última  piedra  en  uno  de  sus  propios  orificios, 
que  estaba  vacío  y ocurre  que  el  orificio  del  contrario  situado  justo  en  Fren- 
te (A  y a,  por  ejemplo)  tiene  al  mera  os  una  piedra,  el  jugador  debe  colocar 
su  piedra  y todas  las  que  contenga  el  orificio  del  contrario  en  el  kalah  de 
este  último,  perdiendo  su  lumú  de  mover,  es  decir,  es  ahora  el  contrario 
el  que  puede  realizar  su  movimiento. 

— Si  el  jugador  coloca  la  última  piedra  en  un  orificio  que  no  cumpla 
las  condiciones  anteriores,  no  ocurre  nada  especial,  y es  el  contrario  el 
que  mueve  a continuación. 
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La  estructura  y desarrollo  del  juego  hacen  conveniente  una  imple  trien- 
tación  computar ional  que  haga  uso  de  algún  procedimiento  de  búsqueda. 
Distintas  realizaciones  han  optado  por  la  utilización  del  procedimiento  al- 
ia beta.  Para  el  caso  del  kalah,  la  función  de  evaluación  que  utiliza  el  pro- 
cedimiento se  basa  en  un  parámetro  k que  se  denomina  n ventaja  kalah*. 
Por  definición,  este  valor  es,  en  cada  momento,  igual  a la  diferencia  entre 
d número  de  piedras  que  contiene  el  kalah  de  la  máquina  y el  número  de 
piedras  que  contiene  el  kalah  del  contrincante  humano.  También  puede 
utilizarse  una  Función  de  evaluación  más  compleja,  añadiendo  al  paráme- 
tro k una  distribución  de  probabilidad  que  resulte  adecuada  al  juego. 
Los  programas  ya  realizados  para  este  juego  han  dado  prestaciones  muy 
satisfactorias,  por  lo  que  no  se  ha  abordado  ía  tarea  de  la  implementacíón 
del  juego  uú fizando  alguna  otra  técnica  de  1A.  Por  otra  parte,  la  estructura 
y formulación  de!  juego  no  parecen  prestarse  al  uso  de  técnicas  más  sofis- 
ticadas que  la  búsqueda  heurística. 

Respecto  a los  programas  que  están  en  estos  momentos  Fúneionando. 
pueden  mencionarse  los  realizados  por  John  McCarthy  y alguno  de  sus  es- 
tudiantes, y por  John  Dixon  y James  R.  Slagle.  Ambos  utilizan  el  procedi- 
miento alfa-beta,  aunque  con  ligeras  variaciones  en  cuanto  al  criterio  de 
terminación  y la  ordenación  de  los  nodos  del  árbol  de  búsqueda 

El  funcionamiento  de  estos  programas  puede  considerarse  muy  bueno, 
ya  que  casi  siempre  derrotan  a sus  adversarios  humanos.  Desafortunada- 
mente, estos  programas  no  tienen  la  posibilidad  de  aprender  a la  vista  de 
los  resultados  y desarrollos  de  diferentes  partidas. 

McCarthy  demostró  con  su  progama  que  existe  una  estrategia  vence- 
dora, es  decir,  una  secuencia  de  movimientos  que  llevan  al  jugador  a la  vic- 
toria independientemente  de  lo  que  haga  el  contrario,  incluso  sí  éste  es  el 
programa.  Un  contrincante  humano  puede  llegar  a descubrir  esta  secuen- 
cia de  movimientos  mediante  un  procedimiento  de  prueba  y error,  o pue- 
de hacerlo  más  fácilmente  haciendo  que  el  programa  juegue  contra  él 
mismo. 


= MASTERMIND 


Este  juego  consiste  en  utilizar  la  lógica  para  descifrar  una  clave  de 
colores  determinada  anteriormente.  El  método  consiste  en  hacer  una  hi- 
pótesis. ver  los  resultados  que  se  obtienen  y.  en  base  a esta  información, 
realizar  más  hipótesis. 

La  información  que  se  obtiene  consiste  en  el  número  de  colores  que 
coinciden  con  la  clave,  haciendo  distinción  entre  los  colores  que  están  co- 


1 13 


tocados  correctamente  y los  que  aun  perteneciendo  a la  clave,  no  están 
situados  en  su  tugar  correcto. 

Una  forma  de  resolver  el  problema  es  Utilizar  todas  las  informaciones 
obtenidas  hasta  el  momento  y generar,  a partir  de  ellas,  las  posibles  eran» 
bi naciones  de  colores  que  no  contradigan  ninguna  premisa,  Una  vez  he- 
cho esto,  se  elige  una  de  ellas  y se  utiliza  como  nueva  hipótesis,  y en  Fun- 
ción de  la  información  obtenida  se  repite  eí  proceso.  La  eficacia  del  pro- 
grama depende  de  lo  acertada  que  sea  la  elección  de  una  nueva  clave.  El 
número  de  jugadas  necesarias  para  descubrir  la  clave  no  suele  pasar  de 
cinco, 

La  formal  ilación  se  puede  realizar  mediante  un  Sistema  de  Producción, 
en  el  que: 

A)  La  Base  de  Hechos  está  formada  por  todos  los  códigos  de  colores 
que  no  contradicen  las  hipótesis.  En  principio,  la  base  estará  formada  por 
todas  las  combinaciones  posibles.  Si  se  juega  con  seis  colores  y el  código 
es  de  cuatro  colores,  pu  di  endo  repetirlos,  se  tiene  un  total  de  4.096  posi 
bilidades.  Y en  cada  momento  contiene  las  combinaciones  que  no  contra- 
dicen ninguna  información  recibida. 

La  estructura,  de  la  Base  de  Hechos  puede  ser  la  siguiente: 

((Cj  | Cu  C,s  Cu)  (Cir  C2Í  Cu  C j,j)......{Cn|  coJ  Ctt4)) 

donde  puede  ser 

1 . Un  color  simple.  Es  decir,  uno  de  los  seis  colores,  está  colocado  en 
h posición  j en  la  combinación  í4  en  este  caso,  es  un  átomo, 

2.  Un  color  compuesto.  Una  serie  de  colores  pueden  estar  colocados 
en  la  posición  i en  la  combinación  j.  En  este  caso,  es  una  lisia. 

1.  tfn  asterisco,  todos  los  colores  pueden  estar  en  la  posición  i en  Ja 
combinación  j. 

Esto  permitirá  reducir  considerablemente  el  volumen  de  la  base  de  he- 
chos. Asi,  la  base  inicial  se  puede  representar  por: 

CC*“» 

Una  combinación  como  la  siguiente: 

((R  V)  AZ  AM  B) 

se  interpreta  como  si  se  tuviesen  las  dos  combinaciones  siguientes: 
((R  AZ  AM  B}  (V  AZ  AM  B)) 

Los  seis  colores  posibles  con  los  que  se  trabaja  son: 

Rojo:  R Azul:  AZ  Amarillo:  AM  Verde:  V Blanco:  B Negro:  N 
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Las  reglas  consistirán  en  formar  todas  las  combinaciones  posibles  en 
Eunción  de  la  información  obtenida. 

Las  posibles  informaciones  son: 

— 1 Cero, 

— 2 Un  muerto. 

— 3 Un  herido, 

— 4 Un  muerto  y un  herido. 

— S Un  muerto  y dos  heridos. 

— Ó Un  muerto  y tres  heridos, 

— 7 Dos  muertos. 

— 8 Dos  heridos. 

— 9 Dos  muertos  y un  herido. 

— 10  Dos  muertos  y dos  heridos, 

— i ! Tres  muertos. 

— 1 2 Tres  heridos. 

— 13  Cuatros  heridos. 

— 14  Cuatro  muertos. 

Cada  una  de  estas  informaciones  va  a dar  lugar  aun  número  finito  de 
posibles  combinaciones  de  colores  que  restringen  cada  vez  más  el  núme- 
ro de  soluciones  posibles- 

Por  convención  se  utiliza  la  variable  A para  representar  el  color  que 
aparece  en  el  primer  lugar  de  la  hipótesis  que  se  está  tratando,  B para  el 
correspondiente  al  segundo  lugar,  C para  el  tercero  y D para  d cuarto.  En 
cada  caso  estos  colores  tienen  un  valor  determinado.  Además,  se  utiliza  la 
variable  %,  que  contendrá  una  lista  con  los  colores  que  no  aparecen  en  la 
hipótesis. 

La  información  número  L dara  lugar  a que  se  supriman  en  la  base  de 
datos  todas  las  combinaciones  que  contengan  uno  de  los  colores  de  la  hi- 
pótesis nn  una  posición  simple,  que  desaparezca  el  color  en  todas  las  com- 
binaciones que  lo  posean  en  una  posición  compuesta  y en  caso  de  que  una 
posición  posea  un  asterisco,  se  transformará  en  una  posición  compuesta 
con  los  colores  que  no  aparecen  en  la  hipótesis.  Esto  se  puede  represen- 
tar, como  regía,  de  la  siguiente  forma: 

SI  1 ENTONCES  {>111} 

Si  se  obtiene  la  información  2.  las  posibles  combinaciones  son: 

ÍA*«)  Í*B»)  tHCl)  (lilDl 
que  darán  lugar  a cuatro  reglas: 

Si  2 ENTONCES  (AHI) 

Si  2 ENTONCES  (IB* J) 

Si  2 ENTONCES  (||C$) 

Si  2 ENTONCES  (JJJD) 


que  se  puede  compactar  de  la  si  guien  le  forma: 

Si  2 ENTONCES  (A*»)  (ISIJ)  (IÍCJ)  («ID) 

L&  información  3 da  lugar  a la  siguiente  reatar 

Si  3 ENTONCES  (fA$)  A (AI)  (A|) 

Í(A$>  (A$)  A CA$» 

UAS)  (Aí)  (Al)  A) 

(BCRSMBSMB*» 

<(B*J  <BJ)  B ÍBS» 

Í(BJ)  (B|)  (B$)  B) 

(C  (C()  (Cl)  (C(j) 

<(Cf)  C ÍCI)  (Cl)) 

(CCS)  (C|>  (CS)  C) 

(D  íDS)  (DS)  (D*>) 

((DI)DíDS)  (DS)) 

((DS)  (Di)  D (DI)) 

Para  el  caso  4 las  combinaciones  posibles  darían  lugar  a !a  siguiente 
regla: 

Si  4 ENTONCES  (A  (AS)  (ABJ)  (AB|>) 

(A  (ACS)  (AS)  (ACS)> 

(A  (ADS)  ÍADS)  (AS» 

{(BCI)  B (CS)  ÍBCS)) 

((BDS)B(BDI)  (BJ)) 

((CD|)  (CDS)  C <C*)> 

((BS)  B (ABS)  ÍABSÍ) 

((CS)  (ACS)  C (ACS)) 

((DJ)  (ADS)  (ADS)  D) 

((BCS)  (CS)  C ÍBCS» 

(ÍBDS)  (DI)  (BDS)  D) 

(ÍCDS)  (CDI)  (DI)  D) 

A partir  de  aquí,  la*  reglas  se  complican  debido  a que  aumenta  cí  nú- 
mero de  combinaciones  concretas  posibles,  pero  en  comparación,  restrin- 
ge más  el  campo  de  búsqueda. 

Si  aparece  la  información  número  catorce,  entonces  se  ha  encontrado 
la  combinación  correcta: 

SI  14  ENTONCES  {A  B C D) 

La  aplicación  de  una  regla  consistirá  en  tomar  cada  una  de  las  partes 
izquierdas  y compararla  con  cada  combinación  de  la  base  de  datos.  La  nue- 
va base  de  hechos  se  crea  con  las  combinaciones  que  cumplen  las 
condiciones. 

La  estrategia  a seguir  consiste  en  ejecutar  todas  las  regías  posibles  for- 
mando el  conjunto  de  combinaciones  que  no  contradicen  la  información 
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recibida.  Para  dio  se  comparan  todas  las  combinaciones  que  se  crean  con 
las  reglas  con  las  que  ya  existen  en  la  base  de  hechos.  La  nueva  base  de 
hechos  se  obtiene  de  la  intersección  de  ambos  conjuntos.  La  elección  de 
la  siguiente  hipótesis  se  realiza  de  la  siguiente  forma:  se  realiza  una  esta- 
dística que  reflejé  la  probabilidad  de  que  un  color  aparezca  en  una  deter 
minada  posición,  para  cada  color  y cada  posición.  Y se  elige  para  nueva 
hipótesis  los  colores  que  tengan  más  probabilidades  de  aparecer  en  cada 
posición. 


ELNIM 

Este  juego,  a pesar  de  ser  muy  sencillo,  posee  muchas  vanantes  de  prác- 
lita.  La  más  común  es  la  que  va  a explicare  en  este  apartado.  Las  reglas 
son  simples:  lo*  jugadores  extraen  alternativamente  de  una  fila  de  objetos 
cl  número  de  objetos  que  deseen,  dentro  del  margen  comprendido  entre 
I y la  mitad  del  total  de  objetos  que  queden  en  la  fila.  Por  ejemplo,  si  en 
un  momento  dado  la  fila  está  formada  por  21  objetos,  podrá  retirarse  un 
número  de  objetos  comprendido  entre  L y 10,  Cañará  aquel  jugador  que 
retire  el  último  objeto  de  la  fila. 

La  estrategia  ganadora  de  este  juego  es  muy  conocida:  se  ha  de  inten- 
tar dejar  siempre  al  oponente  un  número  de  objetos  que  pertenezca  a la 
Míríe  2"1.  Es  decir,  los  números  I,  3,  7,  15,  31,  63,  ...  Estos  números  reci- 
ben también  ei  nombre  de  posiciones  -seguras*.  Se  denominan  asi  puesto 
que,  con  independencia  de  las  posibles  jugadas  del  contrincante,  estas  po- 
siciones forman  um  camino  que  conduce  a la  victoria  dentro  del  árbol  de 
búsqueda.  Se  puede  comprobar  que  si  se  desarrolla  un  árbol  *Y-Q*  de  este 
problema,  se  obtiene  un  camino  seguro  a !a  meta  (se  gana  al  conirinean- 
te),  al  seguir  está  estrategia. 

Si  se  estudia  esta  estrategia  pueden  deducirse  una  cuantas  conclusio- 
nes. Si  al  principio  del  juego  la  fila  está  constituida  por  un  número  de  ob- 
jetos perteneciente  a dicha  serie,  entonces  el  ganador  será  el  que  juegue 
en  segundo  lugar.  Esto  se  cumplirá  siempre  que  éste  siga  la  estrategia  des- 
crita, La  explicación  es  elemental:  si  hay  2a'1  objetos  al  principio,  sólo  po- 
drá quitar  un  número  de  objetos  comprendido  entre  1 y (2"-l)/2,  Pero  el 
siguiente  número  de  la  serie  al  2 " 1 es  el  2*"1—  1.  Este  número  no  puede  al- 
canzarse si  sólo  podemos  quitar  un  número  entre  I y (2*’'l)/2.  Por  tanto, 
el  primero  en  dejar  objetos  en  la  fila  sera  el  segundo  jugador.  Si  se 

parte  de  la  base  de  que  juega  siguiendo  la  estrategia  descrita,  entonces  ga- 
nará ¡remisiblemente. 

De  igual  Forma  se  puede  llegar  a la  conclusión  de  que  si  cl  número  de 
partida  no  pertenece  a dicha  serie,  el  ganador  sera  cl  primer  jugador,  si  s¡- 
guc  la  estrategia.  De  todo  esto  se  extrae  la  conclusión  de  que  si  los  dos  ju- 
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paitares  siguen  la  estrategia  ganadora,  d ganador  se  conoce  desde  él  prin- 
cipio dd  juego.  Por  tanto,  es  un  juego,  en  cierto  mudo,  determinista. 

Todo  este  proceso  es  muy  fácil  de  implementar  medíame  cualquier  pro* 
grama  de  computador.  A huta  bien,  es  muy  sencillo  también  construir  un 
Sistema  de  Producción  en  base  a la  estrategia.  La  ventaja  de  un  Sistema 
de  Producción  en  este  caso  es  que  está  autodocumentado,  como  todos 
ellos.  Por  tanto,  es  fácil  seguir  su  funcionamiento.  La  Base  de  Hechos  es- 
tará formada  por  el  número  de  objetos  que  quedan  en  la  fita.  Al  principio, 
la  Base  contendrá  el  número  inicial  de  objetos:  con  que  se  desee  comenzar. 

La  Base  de  Reglas  estará  Formada  por  sólo  dos  reglas: 

SI  número  é serie  2""1  ENTONCES  Quitar  (I) 

SI  número  4 ENTONCES  Quitar  (Calcular-Número) 
donde, 

— el  procedimiento  Quitar  (n),  quita  n objetos  de  la  fila.  Es  decir,  cam- 
bia el  valor  del  único  elemento  de  la  Base  de  Hechos  de  la  siguiente  forma: 

numero  - número  - n 

— la  función  Calcular-Número,  calcula  d número  perteneciente  a la 
serie,  inmediatamente  inferior  al  número  de  la  Base  de  Hechos. 


La  Estrategia  de  Control  pedirá  las  jugadas  del  contrincante,  pregun- 
tándole el  número  de  objetos  que  quiere  retirar  de  la  fila.  Con  ese  número 
llamará  al  procedimiento  Quitar  y,  por  último,  disparará  la  regla  que  se 
pueda  ejecutar,  comenzando  d ciclo  otra  vez.  Puede  observarse  que  este 
Sistema  de  Producción  no  podrá  tener  nunca  conjunto  confite to  y además 
resulta  demasiado  elemental, 

La  importancia  de  esté  juego  consiste  en  comprobar  que  existen  estra- 
tegias ganadoras  que  ya  desde  el  principio  del  juego  dirigen  el  sistema  ha- 
da la  victoria,  dependiendo  de  la  situación  inicial. 


«OTHELLÜ* 

El  juego  del  -othello>  tiene  origen  japonés,  y se  ha  extendido  profusa- 
mente por  todos  los  países  del  mundo  gracias  a su  comercialización  y a su 
sencillez.  Goza  de  La  fama  de  ser  un  juego  extremadamente  sencillo  de  co- 
nocer, pero  difícil  de  dominar  en  su  totalidad.  La  leyenda  atribuye  su  do- 
minio a los  monjes  que  dedican  gran  parte  de  su  vida  a la  meditación,  y 
que,  al  parecer,  utilizan  el  juego  como  pane  de  su  aprendizaje. 

Los  materiales  necesarios  para  el  juego  son  un  cablero  con  64  cuadros 
sin  distinción  de  colores,  y 64  fichas  circulares  planas  con  un  color  dife- 
rente en  cada  cara,  una  de  ellas  blanca  y la  otra  negra. 

Los  jugadores  eligen  un  color  (blanco  o negro)  y mantienen  ese  color 
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durante  todo  el  juego.  Antes  de  iniciarse  la  partida  deben  colocarse  cuatro 
fichas  sobre  el  tablero  de  la  siguiente  forma: 


o 

• 

□E 

_ 

_ 

A partir  de  esta  situación  el  primer  movimiento  está  reservado  para  el 
jugador  que  utiliza  las  fichas  de  color  negro.  Un  movimiento  consiste  en 
la  colocación  de  una  ficha  al  lado  de  otra  del  oponente,  ya  sea  en  direc- 
ción horizontal,  vertical  o diagonal.  Esta  ficha  tiene  la  misión  de  atrapar 
una  o varias  de  las  fichas  del  jugador  contrario.  Quedan  atrapadas  todas 
las  fichas  de  distinto  color  que  se  encuentren  situadas  entre  dos  fichas  del 
jugador  que  mueve.  Las  fichas  capturadas  se  dan  la  vuelta  y quedan  del  co- 
lor del  jugador  que  las  att^apó  pasando  asi  a ser  de  su  propiedad.  El  núme- 
ro de  fichas  que  pueden  ser  capturados  en  una  jugada  en  cualquier  direc- 
ción o en  varias  direcciones  sólo  se  encuentra  limitado  por  el  número  de 
fichas  que  en  el  momento  estén  sobre  el  tablero. 

Los  jugadores  realizan  sus  colocaciones  de  fichas  en  tumo  alternativo. 
Si  en  uno  de  sus  turnos  uno  de  los  jugadores  no  tiene  posibilidad  de  cap- 
turar una  ficha  de  su  oponente,  perderá  el  turno  y no  podrá  jugar  hasta 
que  pueda  colocar  uná  ficha  que  capture  al  menos  una  ficha  de  su  rival. 
Mientras  uno  de  los  jugadores  no  puede  poner,  el  otro  continúa  jugando, 
dando  la  vuelta  a todas  las  fichas  que  le  sea  posible. 

El  juego  termina  cuando  sucede  alguna  de  las  siguientes  cosas: 

— El  tablero  se  ha  llenado  de  fichas. 

— A uno  de  ios  jugadores  no  le  queda  ninguna  ficha  de  su  color  sobre 
el  tablero. 

— Ninguno  de  los  jugadores  puede  colocar  una  ficha  que  atrape  otra 
del  oponente. 
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V na  ve*  Ierro  i nandú  el  juego,  se  cuenta  el  nú  mero  de  fichas  de  c ada  co- 
lor  y gana  el  jugador  que  haya  acumulado  más  fichas  de  *u 
color. 

El  juego  del  «othdlo*  es  eminentemente  estratégico  y,  aunque  es  per 
fcciamentc  factible  su  realización  en  un  computador  mediante  una  bús- 
queda de  cualquier  tipo,  parece  mucho  más  adecuada  la  utilización  de  mé- 
todos que  permitan  una  buena  representación  de  las  estrategias  que  de- 
ben  aplicarse  en  el  juego. 

En  cuanto  a la  estrategia,  pueden  resultar  útiles  algunas  ideas  que  no 
son,  en  absoluto,  las  únicas  ni  las  más  acertadas,  pero  que  pueden  guiar 
las  acciones  de  jugadores  no  demasiado  familiarizados  con  el  juego. 

Hay  que  señalar  en  principio  que  los  dos  jugadores  no  se  encuentran 
exactamente  en  igualdad  de  condiciones  al  comienzo  del  juego.  Existe  una 
ligera  ven  laja  para  el  jugador  que  empieza  a mover  el  primero.  No  puede 
asegurarse  que  exista  una  secuencia  fija  de  acciones  que  conduzca  al  ju- 
gador que  inició  el  juego  a la  victoria,  pero  es  cierto  que  su  posición  le  per- 
mdc  marcar  de  alguna  manera  el  camino  del  juego,  lo  que  le  concede  una 
evidente  ventaja.  El  segundo  jugador,  a no  ser  un  experto  en  la  materia, 
ira  siempre  obligado  a jugar  en  determinadas  posiciones,  que  es  de  espe- 
rar no  sean  las  que  más  favorezcan  su  juego.  Suele  recomendarse  la  alter- 
nancia del  color  de  las  fichas  entre  los  jugadores,  de  forma  que  el  tumo 
tic  salida  se  alterne  de  la  misma  manera,  y no  corresponda  la  ventaja  siem 
prc  al  mismo  jugador. 

Una  buena  estrategia  de  juego  consiste  en  hacerse  dueño  lo  antes 
sible  de  los  rincones  del  tablero,  es  decir,  de  tos  cuadros  situados  en  la* 
esquinas  Uslüs  puntos  son  posiciones  especialmente  fuerte*  para  eljuga- 
dor  que  se  apodera  de  ellos,  ya  que  3a  ficha  colocada  en  una  esquina  no 
puede  ser  nunca  atrapada  por  otra  ficha  del  contrario.  De  igual  forma  tam- 
bién las  posiciones  de  los  bordes  del  tablero  tienen  importancia,  ya  que 
las  fichas  situadas  sobre  ellas  sólo  presentan  dos  direcciones  de  ataque 
por  lo  que  pueden  ser  vigiladas  con  más  facilidad. 

En  general,  puede  decirse  que  un  jugador  debe  tender  a realizar  un  blo 
queo  con  fichas  de  su  color,  a ser  posible  en  un  rincón  o en  un  borde  lu- 
gares en  ]0S  que  resulta  más  sólido,  y en  la  mavoria  de  Jas  ocasiones  con- 
duce a la  victoria.  También  cabe  señalar  que  los  buenos  jugadores  no  re- 
comiendan siempre  la  jugada  que  atrape  d mayor  número  de  fichas  sino 
aquella  que  tiende  a una  situación  de  mayor  dominio  posieional  sobra  el 
tablero, 

Por  lo  que  se  refiere  a la  programación  del  juego  propiamente  dicha 
hav  que  indicar  que  puede  realizarse  utilizando  el  procedimiento  alfa-beta 
*m  demasiados  problemas.  E]  tablero  puede  representarse  mediante  una 
matriz  de  10  por  10,  aunque  sus  dimensiones  son  8 por  8,  Este  aumento 
en  el  numero  de  casillas  se  utiliza  para  facilitar  la  verificación  de  las  juca 
das.  Así,  una  jugada  seré  válida  si  permite  capturar  una  o varias  fichas  con 
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trarias  y si  la  posición  se  encuentra  en  la  submatri*  de  8 p°r  8 que  repre- 
senta el  labk-ro  real 

El  cálculo  de  la  función  estática  de  evaluación,  necesaria  para  el  pro- 
cedimiento, se  realiza  por  medio  de  una  tabla  que  contiene  el  valor  estra- 
tégico que  se  concede  a cada  movimiento.  Para  conceder  un  valor  estra- 
tégico a cada  posición  se  utiliza  también  una  matriz  auxiliar  que  contiene 
los  valores  correspondientes  En  esta  matriz  los  valoras  más  altos  son  los 
que  corresponden  a las  esquinas  del  tablero,  de  las  que  ya  se  ha  comenta- 
do su  importancia.  Evidentemente,  los  valores  de  las  posiciones  de  la  ma- 
triz auxiliar  pueden  modificarse  con  cada  una  de  las  jugadas  que  se 
realizan. 

Es  posible  mejorar  la  eficacia  de  la  búsqueda  si  se  examina  en  cada  si- 
tuación la  mejor  jugada  en  lugar  de  una  jugada  cualquiera  de  las  posibles. 
Aunque  en  el  desarrollo  del  juego  esta  mejor  jugada  se  desconoce,  puede 
aún  realizarse  una  considerable  mejora  estudiando,  en  primer  lugar,  las  ju- 
gadas aparentemente  más  favorables.  Es  decir,  se  deberían  estudiar  las  ju- 
gadas en  el  siguiente  orden: 

— Jugadas  que  llevan  consigo  la  pérdida  de  la  esquina, 

— - Jugadas  en  posiciones  adyacentes  a las  esquinas. 

— Jugadas  peligrosas  en  las  orillas  de  una  zona  tomada  por  d 
adversario. 

— Jugadas  en  la  cruz  central  del  tablero. 

— Jugadas  favorables  en  tas  orillas. 

La  ordenación  de  estas  jugadas  se  realiza  mediante  el  estudio  del  j¡uc- 
go,  de  acuerdo  con  las  estrategias  que  ya  se  han  mencionado. 


m JUEGO  DEL  PUENTEO 

El  juego  del  puentco,  también  denominado  dd  camino,  constituye  un 
buen  ejemplo  de  juego  posieional,  es  decir,  cuyo  desarrollo  depende  casi 
totalmente  de  las  posiciones,  tanto  absolutas  como  relativas,  de  los  distin- 
tos elementos  sobre  el  tablero  de  juego.  Otros  ejemplos  de  juegos  de  este 
tipo  son  el  «fic-tao-toc*,  «hex»,  *qubic*,  etc. 

En  este  juego,  el  tablero  es  un  rectángulo  cubierto  con  puntos  blancos 
y negros  alternos  por  filas  como  muestra  la  figura  18. 

Como  puede  verse,  los  bordes  opuestos  son  del  mismo  color.  En  el  jue- 
go intervienen  dos  jugadores.  Cada  uno  de  ellos  debe  elegir  uno  de  tos  dos 
colores,  que  será  el  que  mantenga  durante  el  desarrollo  completo  de  una 
partida.  El  juego  consiste  en  unir,  por  turnos  alternativos,  dos  de  los  pun- 
tos contiguos  de  un  color  mediante  una  linea.  Un  jugador  sólo  puede  uti- 
lizar los  punios  del  color  que  ha  elegido  antes  del  comienzo  de  la  partida. 
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FJ  objetivo  de  cada  jugador  es  conseguir  llegar  desde  d borde  de  partida 
hasta  el  borde  opuesto  mediante  una  cadena  de  trazos  sin  solución  de  con- 
tinuidad, es  decir,  mediante  una  linca  continua.  La  única  restricción  c*ís- 
terne  es  la  imposibilidad  de  cruzar  en  ningún  caso  una  linea  dibujada  por 
el  jugador  cont  rarío. 

Suele  considerarse,  por  Lanío,  un  borde  de  cada  color  como  origen  y 
d otro  como  meta,  de  forma  que  los  jugadores  tratan  de  construir  un 
■ puente*  desde  uno  de  tos  puntos  del  borde  origen  hasta  uno  de  los  dd 
borde  meta. 

Puede  demostrarse  sm  demasiada  dificultad  que  en  este  juego  chiste 
una  estraicgia  ganadora  para  el  jugador  que  realiza  el  primer  movimiento 
Esia  interesante  característica  es  común  a la  mayoría  de  los  juegos 
peticiónales. 

La  resolución  de  este  juego  mediante  un  programa  de  computador  no 
parece  seguir  el  camino  de  los  procedimientos  de  búsqueda  clásicos  en  jue- 
gos, La  apaienie  simplicidad  de  Jas  estrategias  que  pueden  utilizarse  ha- 
cen más  adecuada  la  realización  de  programas  que  tengan  presente  la  es- 
tructura CONDICION  - ACCION,  típica  de  los  Sistemas  de  Producción, 
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Una  forma  de  tratamiento  de!  juego,  descubierta  por  Olivcr  Cross,  uti- 
liza una  estrategia  bastante  simple.  Para  su  explicación  considérese  el  ta- 
blero dividido  por  la  diagonal  AB  como  muestra  ia  figura  19.  Supóngase 
que  el  programa  es  el  jugador  que  utiliza  los  puntos  negros.  Dependiendo 
de  la  elección  del  oponente,  d programa  debe  replicar  con  las  siguientes 
acciones: 

— Si  el  oponente  une  uno  de  sus  circuios  con  una  linea  horizontal,  la 
respuesta  debe  ser  la  que  muestra  la  figura  20, 


FiK.  20 . 


— Si  d oponente  une  dos  de  sus  punios  que  se  encuentran  por  enci- 
ma de  la  diagonal  entune  es  replicar  de  la  forma  que  muestra  la  Figura  21. 
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Fíg-  2Í , 

— Si  el  oponente  une  dos  de  sus  puntos  situados  por  debajo  de  la  dia- 
gonal, la  respuesta  debe  ser  la  expresada  en  la  figura  22. 

I 

Fig-  22, 

Si  el  programa  comienza  el  juego  y sigue  esta  estrategia,  su  victoria  está 
garantizada.  Su  primer  movimiento  debe  unir  los  puntos  que  se  muestran 
en  la  figura  23, 
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La i form»  especifica  de  programar  es  ja  estrategia  depende  en  gran  me 
dnia  de  la  representación  que  se  utilice  para  el  tablero  v para  tos  movi- 
mientos. Una  posible  forma  de  representación  podría  consistir  en  nume- 
rar tos  espacios  entre  los  puntos,  ya  sea  por  filas  o por  columnas,  de  forma 
que  cada  movimiento  quedara  determinado  por  el  número  del  hueco  que 
ha  cruzado  la  linea  que  une  tos  dos  puntos  Con  este  esquema  es  posible 
utilizar  algoritmos  numéricos  que  calculen  el  movimiento  más  ventajoso 
en  función  de  la  estrategia  elegida. 

Otra  posibilidad  es  representar  la  estrategia  en  forma  de  una  tabla  de 
valores  que  tipifique  cada  réplica  a un  movimiento  dado.  El  programa,  en- 
tonces, debe  guiar,  sus  acciones  mediante  búsqueda  en  las  tablas. 


= «TIC-TAC-TOE» 

Este  juego  es  una  simplificación  de  las  tres  en  raya.  Se  tiene  un  tablero 
de  3 por  3 casillas,  que  se  numeran  para  mayor  comodidad.  Hay  dos  ad- 
versarios que  van  jugando  por  tumo,  colocando  cada  una  de  sus  fichas  en 
una  casilla  libre  del  tablero.  Se  sigile  el  convenio  de  utilizar  las  cruces  V 
para  el  jugador  y las  caras  '0'  para  el  computador. 

El  juego  termina  cuando  uno  de  los  jugadores  ha  completado  con  sus 
fichas  una  fila,  columna  o diagonal  de  tres  casillas,  resultando  ganador.  O 
bien  cuando  se  ha  cubierto  con  las  fichas  todo  d tablero,  terminando  ti 
juego  en  tablas. 

Lz  partida  de  -tic  tac-loe*  puede  trátame  de  dos  formas.  La  primera  es 
un  programa  en  que  hay  definidas  una  serie  de  reglas  que  realizan  uno  u 
otro  movimiento,  dependiendo  de  la  situación  en  que  se  encuentra  la  par 
nda.  La  segunda  forma  sigue  un  método  de  búsqueda  de  situaciones  y eva- 
luación de  las  mismas  mediante  alguna  heurística,  para  elegir  la  mejor. 
Puede  aplicarse  una  búsqueda  Mínima*  con  poda  alfa-beta.  La  bondad  de 
la  imple  mentación  dependerá,  en  el  primer  caso,  de  las  reglas  y la  estra- 
tegia de  control,  y en  el  segundo,  de  la  función  heurística. 

En  la  primera  forma  de  implcmentación  la  elección  de  la  casilla  a ju- 
gar se  realiza  mediante  un  Sistema  de  Producción.  La  Base  de  Dalos  está 
Formada  por  dos  listas  (Ll  para  la  persona  y L2  para  la  máquina)  que  con- 
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tienen  la  casillas  ocupadas  por  cada  uno  de  los  jugadores.  Por  otro  lado, 
existen  una  serie  de  cláusulas  definidas  al  principio  del  programa  que  per- 
mitirán disponer  de  un  conjunto  de  propiedades  de  las  casillas  del  tablero 
necesarias  en  algún  momento  determinado.  Estas  propiedades  pueden  ser 
las  casillas  que  hay  en  el  Eablcro,  las  casillas  situadas  en  las  esquinas  y las 
centrales,  asi  como  propiedades  de  la  linea. 

Las  reglas  constan  de  una  pane  de  condición  y otra  de  acción,  que  con- 
siste simplemente  en  seleccionar  la  casilla  que  corresponde  jugar,  y que 
se  incuye  en  la  lisia  L2  de  la  máquina.  La  pane  de  condición  son  el  con- 
junto de  predicados  que  deben  verificarse. 

Las  regias  incluidas  son; 


a)  En  caso  de  encontrarse  con  una  línea  que  tiene  dos  fichas  de  la  má- 
quina y una  casilla  vacía,  se  ocupara  esta  casilla,  ganando  la  partida. 
Ver  fig.  24. 

b)  Se  tiene  una  linea  con  dos  fichas  del  jugador  y una  casilla  vacía,  se 
ocupa  esta  para  evitar^ue  gane  el  jugador.  Ver  fig.  25, 


c)  Se  intenta  realizar  una  ofensiva  que  conduzca  a la  victoria,  al  con- 
seguir tener  dos  lineas  con  dos  fichas  de  la  máquina  en  cada  linca  v las  res- 
tantes casillas  vacias.  Para  conseguirlo,  si  se  encuentran  dos  líneas  cada 
una  con  una  ficha  de  la  máquina  y el  resto  vacias,  se  ocupa  la  casilla  in- 
tersección de  las  dos  lincas.  Ver  fig.  26. 

d)  Se  intenta  responder  satisfactoriamente  a una  situación  del  mismo 
tipo  que  en  c).  En  este  caso,  se  debe  ocupar  una  casilla  central  de  una  de 
las  dos  lineas.  Ver  fig.  27. 
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Fig.  27.  Fig.  28.  FiS  29 

Las  dos  situaciones  son  iguales,  sólo  vana  la  respuesta  dependiendo  de 
quién  lleve  la  iniciativa. 
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c)  Se  ocupa  el  centro  dd  tablero  en  caso  de  estar  vacío  debido  a su 
importancia.  Ver  fig.  28. 

f)  Cuando  se  tiene  una  línea  que  contiene  sólo  una  ficha  de  la  máquina, 
íe  coloca  otra  ficha  para  tener  dos  en  raya,  llevando  asi  la  iniciativa.  Ver  fig.  29- 

g)  Se  ocupa  cualquier  casilla  que  esté  vacia.  Ver  llg,  JO. 


O 


Eti  caso  de  no  jugar  bien  bastaría  ton  cambiar  las  reglas  anteriores  por 
otras  mejores. 

En  la  imple  mentación  pueden  realizarse  una  restricción  y un  filtrado  de 
las  reglas  para  después  elegir  la  más  apropiada,  o realizar  la  exploración 
secuencia I de  las  mismas.  En  este  último  caso  la  estrategia  de  control  se- 
ria elegir  la  primera  regla  que  satisfaga  su  parle  izquierda. 

El  método  alternativo  es  la  elección  de  la  jugada  mediante  Lh  construc- 
ción de  un  árbol  de  búsqueda  Mínima*,  empleando  poda  alia-beta. 
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El  árbol  de  búsqueda  puede  tener  solamente  un  nivel  'dos'  de  pro- 
fundidad. un  nivel  para  las  posibles  acciones  de  maximización  y otro  para 
las  de  mi  ni  miración,  como  compromiso  entre  d nivel  óptimo  de  evalua- 
ción para  el  *úc-tac-toc*  y un  tiempo  de  respuesta  satisfactorio,  ya  que  con 
una  profundidad  de  'cuairo'  se  podría  afrontar  cualquier  situación  sin  po- 
sibilidad de  sorpresas. 
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El  árbol  sólo  tendré  un  nivel  'MAX  y otro  MIN':  como  consecuencia, 
no  va  a realizarse  ningún  corte  por  debajo  de  ningún  nodo  JMAXJ.  El  algo- 
ritmo alia-beta  se  reducirá  a un  algoritmo  Minimax  con  corles  alfa. 
La  función  de  evaluación  que  se  utiliza  para  una  posición  P es: 


F{F)  - X filas  que  todavía  están  libres  para  MAXimización, 

I filas  que  todavía  están  libres  para  MLNim  i ración. 

El  funcionan] lento  para  una  situación  cualquiera  seria  el  especificado 
en  la  figura  24. 

Hay  una  situación  que  no  se  resuelve  bien;  esto  se  debe  a la  falla  de  pro- 
fundidad del  árbol  para  prever  las  situaciones  que  se  van  a presentar  con 
un  nivel  cuatro1  de  profundidad  no  hay  ningún  problema  la  situación  es 
la  siguiente: 
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en  la  cual  se  produce  la  sucesión  de  jugadas: 
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donde  gana  el  jugador  para  el  que  se  MINinuza. 
Cuando  la  respuesta  correcta  debería  haber  sido: 
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El  programa  tiene  que  generar  el  árbol.  Tendrá  que  tener  un  procedi- 
miento GENERAR-MAX  que  genera  una  posible  jugada  de  MAX  i miración 
y que  llamándose  rccursivamenie  genera  todos  los  nodos  de!  primer  nivel 
de  profundidad  de  árbol.  Otru  procedí  miento  GEN  ERAR- MIN  que  se  lla- 
ma recursivamente  por  cada  jugada  dé  MAXimiración.  con  él  se  obtiene 
el  segundo  nivel  de  profundidad. 

La  elección  de  una  jugada  corresponde  a la  generación  y evaluación 
simultánea  del  árbol  de  búsqueda. 
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